OpenAI ra mắt công cụ tạo video từ văn bản

Admin

12:08 16/02/2024

OpenAI – công ty đang dẫn đầu về trí tuệ nhân tạo (AI) mới đây đã giới thiệu một mô hình AI mới có tên Sora mà họ tuyên bố có thể tạo ra các video dài 60 giây “vừa có tính thực tế” vừa “đầy tính sáng tạo” từ các câu lệnh nhanh bằng văn bản.

Trong một bài đăng trên blog mới đây, công ty OpenAI cho biết Sora có khả năng tạo video có độ dài lên tới 60 giây từ hướng dẫn bằng văn bản, với khả năng cung cấp các cảnh có nhiều nhân vật, các loại chuyển động cụ thể và chi tiết.

Bài đăng trên blog cho biết: “Mô hình này không chỉ hiểu những gì người dùng yêu cầu trong lời nhắc mà còn hiểu những thứ đó tồn tại như thế nào trong thế giới thật”.

OpenAI cho biết họ dự định đào tạo các mô hình AI để có thể “giúp mọi người giải quyết các vấn đề đòi hỏi sự tương tác trong thế giới thực”.

Đây là nỗ lực mới nhất của công ty OpenAI đằng sau chatbot gây sốt ChatGPT. Công ty OpenAI tiếp tục thúc đẩy phong trào đưa AI tạo sinh tiến về phía trước. Theo ông Reece Hayden, nhà phân tích cấp cao của công ty nghiên cứu thị trường ABI Research, mặc dù “các mô hình đa phương thức” không phải là mới và các mô hình chuyển văn bản thành video đã tồn tại, nhưng điều làm nên sự khác biệt của nó là độ dài và độ chính xác mà OpenAI tuyên bố Sora có thể tạo ra.

Ông Hayden cho biết những loại mô hình AI này có thể có tác động lớn đến thị trường giải trí kỹ thuật số với nội dung được cá nhân hóa mới được truyền trực tuyến trên các kênh.

Điều bất ngờ là các video do Sora tạo ra chân thực đến mức đáng kinh ngạc cho thấy khả năng đáng nể của mô hình AI này. Hiện tại, Sora chỉ dành cho một nhóm nhỏ các nhà nghiên cứu và nhà sáng tạo để thử nghiệm trước khi phát hành rộng rãi. Sự xuất hiện của Sora có thể gây ra ảnh hưởng đáng kể đến ngành công nghiệp điện ảnh và khiến cho vấn nạn deepfake ngày càng nghiêm trọng.

“Một trường hợp sử dụng rõ ràng là trong TV; tạo ra những cảnh ngắn để hỗ trợ cho câu chuyện,” chuyên gia Hayden cho biết. “Tuy nhiên, mô hình này vẫn còn hạn chế nhưng nó cho thấy hướng đi của thị trường.”

Đồng thời, công ty OpenAI cho biết Sora vẫn đang trong quá trình hoàn thiện với những “điểm yếu” rõ ràng, đặc biệt là khi nói đến các chi tiết không gian của lời nhắc – nhầm bên trái với bên phải – cũng như nguyên nhân và kết quả. Nó đưa ra ví dụ về việc tạo một video quay cảnh ai đó cắn một miếng bánh quy nhưng lại không có vết cắn ngay sau đó.

Hiện tại, thông điệp của OpenAI vẫn tập trung vào sự an toàn. Công ty cho biết họ có kế hoạch hợp tác với một nhóm chuyên gia để thử nghiệm mô hình mới nhất và xem xét kỹ lưỡng các lĩnh vực khác nhau bao gồm thông tin sai lệch, nội dung thù địch và thành kiến. Công ty về AI cho biết họ cũng đang xây dựng các công cụ giúp phát hiện thông tin sai lệch.

Sora trước tiên sẽ được cung cấp cho các giáo sư an ninh mạng, được gọi là “đội đỏ”, những người có thể đánh giá sản phẩm về tác hại hoặc rủi ro. Nó cũng cấp quyền truy cập cho một số nghệ sĩ thị giác, nhà thiết kế và nhà làm phim để thu thập phản hồi về cách các chuyên gia sáng tạo có thể sử dụng nó.

Bản cập nhật mới nhất được đưa ra khi OpenAI tiếp tục phát triển ChatGPT.