Đây là 5 điều khiến GPT-4 vượt trội các phiên bản tiền nhiệm

Mô hình AI GPT-4 mới của OpenAI vừa có màn ra mắt hoành tráng và đang gây xôn xao cộng đồng công nghệ toàn thế giới. Nhưng điều gì thực sự khiến GPT-4 khác biệt với các phiên bản trước đó như ChatGPT và GPT-3.5?

Tuy nhiên, trước hết hãy dành thời gian một chút để nói về cái tên của nó. Mặc dù ChatGPT ban đầu được mô tả là GPT-3.5, nhưng bản thân nó không phải là một phiên bản của mô hình ngôn ngữ lớn của OpenAI. Mà nó chỉ là một giao diện dựa trên hình thức trò chuyện dành cho bất kỳ mô hình nào hỗ trợ nó. Hệ thống ChatGPT đã trở nên phổ biến trong vài tháng qua chỉ là một cách để người dùng tương tác với GPT-3.5 và giờ đây là một cách để tương tác với GPT-4.

Giờ, hãy cùng điểm qua 5 điểm khác biệt lớn nhất giữa các hệ thống AI tổng quát này.

GPT-4 có thể xem và hiểu hình ảnh

Thay đổi đáng chú ý nhất đối với hệ thống máy học linh hoạt này của OpenAI là nó đã trở nên “đa phương thức”, nghĩa là nó có thể hiểu nhiều hơn một “phương thức” thông tin. ChatGPT và GPT-3 bị giới hạn ở văn bản. Chúng có thể đọc và viết nhưng chỉ có thế mà thôi.

Tuy nhiên, GPT-4 có thể nhận biết hình ảnh và nó sẽ xử lý chúng để tìm thông tin liên quan. Tất nhiên, bạn có thể yêu cầu nó mô tả những gì xuất hiện trong một bức tranh, nhưng quan trọng hơn là sự hiểu biết của nó vượt xa điều đó. Ví dụ hài hước do OpenAI cung cấp liên quan tới việc giải thích các trò đùa bằng hình ảnh liên quan tới những chiếc giắc cắm iPhone quá khổ.

Nhưng không dừng lại ở đó, với sự hợp tác cùng Be My Eyes - một ứng dụng được sử dụng bởi những người mù và thị lực kém - công nghệ này sẽ cho phép các tình nguyện viên mô tả những gì điện thoại của họ nhìn thấy. Nó cũng mở ra một tương lai tươi sáng hơn cho các ứng dụng liên quan.

Đây là 5 điều khiến GPT-4 vượt trội các phiên bản tiền nhiệm - Ảnh 1.

Be My Eyes có nghĩa là “Hãy là đôi mắt của tôi”

Trong video giới thiệu, GPT-4 đã mô tả hoa văn trên một chiếc váy, xác định một loại cây, giải thích cách đến một máy tập nhất định tại phòng tập thể dục, dịch các nhãn dán, đọc bản đồ và biểu diễn một số tác vụ khác cho thấy nó thực sự hiểu được những gì có trong một hình ảnh.

Tất nhiên, có một điều kiện là nó cần được hỏi đúng câu hỏi. Bởi AI biết một bộ trang phục trông như thế nào, nhưng nó có thể không biết liệu đó có phải là trang phục phù hợp cho cuộc phỏng vấn hay đi chơi của bạn hay không.

GPT-4 sẽ khó bị lừa hơn

Một khuyết điểm chung của các AI tổng quát, và cũng là điều mà công chúng lo ngại nhất, là chúng có xu hướng dễ bị lạc lối. Chỉ với một chút dỗ dành, người dùng có thể thuyết phục hệ thống rằng họ chỉ đang mô phỏng và “không làm việc xấu” dù bản chất đang yêu cầu AI hỗ trợ những điều sai trái.

OpenAI cho thấy họ đã tìm ra giải pháp. GPT-4 cho thấy nó đã được đào tạo rất nhiều về các lời nhắc độc hại, thứ mà người dùng đã cung cấp liên tục trong một hoặc hai năm qua. Nhờ đó, mô hình mới này tốt hơn nhiều so với các mô hình tiền nhiệm của nó về “tính thực tế, khả năng điều khiển và từ chối vượt ra ngoài ranh giới”.

Trong ví dụ được cung cấp, GPT-4 sẽ nhận ra và không hỗ trợ người dùng những thứ như cách chế tạo một quả bom hay vũ khí nguy hiểm. Nhìn chung, các biện pháp can thiệp ở cấp độ mô hình của nó sẽ làm tăng độ khó trong việc khơi gợi các hành vi xấu.

Theo cách OpenAI mô tả, GPT-3.5 (hỗ trợ ChatGPT) là một “lần chạy thử nghiệm” của một kiến trúc đào tạo mới và họ đã áp dụng các bài học thu được từ đó cho phiên bản mới. Kết quả cho thấy phiên bản GPT-4 này “ổn định chưa từng có”.

GPT-4 có bộ nhớ dài hơn

Đây là 5 điều khiến GPT-4 vượt trội các phiên bản tiền nhiệm - Ảnh 2.

Những mô hình ngôn ngữ lớn được đào tạo trên hàng triệu dữ liệu là các trang web, sách và dữ liệu văn bản khác. Nhưng khi chúng thực sự trò chuyện với người dùng, sẽ có các giới hạn về mức độ nội dung mà hệ thống có thể “ghi nhớ”.

Giới hạn đó với GPT-3.5 và phiên bản cũ của ChatGPT là 4.096 “mã thông báo”, tức là khoảng 8.000 từ hoặc khoảng 4 đến 5 trang sách. Vì vậy, nó sẽ gần như đánh mất dấu vết của mọi thứ sau khi đã chúng đi quá xa và khiến mức độ chú ý giảm xuống.

Nhưng GPT-4 có số lượng mã thông báo tối đa là 32.768. Điều đó có nghĩa là khoảng 64.000 từ hoặc 50 trang văn bản, đủ cho toàn bộ một vở kịch hoặc truyện ngắn.

Điều này có nghĩa là trong cuộc trò chuyện hoặc quá trình tạo văn bản, nó sẽ có thể ghi nhớ tối đa 50 trang nội dung hoặc hơn. Vì vậy, nó sẽ nhớ những gì người dùng đã nói trước đó 20 trang, hoặc khi viết một câu chuyện hoặc bài luận, nó có thể đề cập đến các sự kiện đã xảy ra ở khoảng 35 trang trước. Về cơ bản, bộ nhớ đã được mở rộng và các khả năng đi kèm tương ứng sẽ tăng trưởng theo.

GPT-4 đa ngôn ngữ hơn

Thế giới AI bị chi phối bởi những người nói tiếng Anh và mọi thứ từ dữ liệu, các thử nghiệm đến tài liệu nghiên cứu đều bằng ngôn ngữ này. Nhưng khả năng của các mô hình ngôn ngữ lớn cho phép chúng có thể áp dụng được trong bất kỳ ngôn ngữ viết nào.

GPT-4 đã tiến thêm một bước để thực hiện điều này bằng cách chứng minh rằng nó có thể trả lời hàng nghìn câu hỏi trắc nghiệm với độ chính xác cao trên 26 ngôn ngữ, từ tiếng Ý, tiếng Ukraina đến tiếng Hàn.

Thử nghiệm ban đầu về khả năng đa ngôn ngữ này đầy hứa hẹn. Nhưng sẽ còn lâu nó mới có thể nắm bắt được đầy đủ các khả năng về đa ngôn ngữ, bởi các tiêu chí kiểm tra đã được dịch từ tiếng Anh và các câu hỏi trắc nghiệm không thực sự đại diện cho lời nói thông thường. Nhưng hệ thống đã chot hấy nó có thể làm rất tốt một thứ mà nó không thực sự được đào tạo riêng, và điều này cho thấy khả năng GPT-4 sẽ thân thiện hơn nhiều với những người không nói tiếng Anh.

GPT-4 có những “cá tính” khác nhau

Đây là 5 điều khiến GPT-4 vượt trội các phiên bản tiền nhiệm - Ảnh 3.

“Khả năng điều khiển” là một khái niệm thú vị trong AI, đề cập đến khả năng thay đổi hành vi của chúng theo yêu cầu của người dùng. GPT-4 đã tích hợp khả năng điều khiển mang tính nguyên bản hơn so với GPT-3.5 và người dùng sẽ có thể thay đổi “tính cách” của ChatGPT thành một thứ gì đó phù hợp hơn với nhu cầu của họ.

Điều này có thể được thực hiện bằng cách “mồi” cho chatbot AI bằng các thông báo như “Giả vờ rằng bạn là GM trong một game nhập vai” hoặc “Trả lời như thể bạn là một người đang được phỏng vấn”....

Có rất nhiều điểm khác biệt giữa GPT-4 và các phiên bản tiền nhiệm của nó, phần lớn được nhà phát triển lồng ghép tinh tế hoặc mang tính kỹ thuật. Và người dùng sẽ dần khám phá ra nhiều điều nữa theo thời gian, trong quá trình trải nghiệm và sử dụng.

Và giờ bạn đang rất muốn tự kiểm tra GPT-4? Hãy đợi một chút. Nó sắp có trên dịch vụ trả phí ChatGPT Plus của OpenAI, và sẽ sớm có sẵn qua API dành cho nhà phát triển và có thể cũng sẽ sớm có bản demo miễn phí trong tương lai gần.

Tham khảo TechCrunch