Chủ Nhật, 12 tháng 3, 2023

GPT-4 sắp trình làng với tính năng video, nhà tiên phong học sâu nói về ChatGPT - AI làm, ai chịu?

 Sơn Vân 

Andreas Braun, Giám đốc công nghệ (CTO) của Microsoft Đức, tiết lộ GPT-4 sẽ được giới thiệu vào tuần tới và bao gồm các mô hình đa phương thức. GPT-4 là bản nâng cấp của GPT-3.5, mô hình xử lý ngôn ngữ đang chạy ChatGPT.

Phát biểu của Andreas Braun ngay lập tức dẫn đến cuộc bàn luận về việc GPT-4 ra mắt chưa đầy 4 tháng sau khi GPT-3.5 được phát hành.

Thật trùng hợp khi nhà tiên phong học sâu Yoshua Bengio, người giành được Giải thưởng Turing 2018 cùng với Geoffrey Hinton và Yann LeCun, cũng vừa nhận xét về ChatGPT và tiềm năng của các mô hình đa phương thức.

Yoshua Bengio là nhà khoa học máy tính và nhà nghiên cứu trí tuệ nhân tạo. Ông là giáo sư tại Đại học Montreal (Mỹ) và được coi là người tiên phong về học sâu, một tập hợp con của học máy liên quan đến việc đào tạo các mạng lưới thần kinh có nhiều lớp để nhận dạng các mẫu trong dữ liệu.

Trong phần Hỏi & đáp trực tuyến có tiêu đề “Điều gì còn thiếu trong ChatGPT? Chắp cánh để đạt đến trình độ thông minh nhân loại”, Yoshua Bengio nói rằng công việc hiện tại trên các mạng lưới thần kinh lớn đa phương thức, có hình ảnh hoặc video cũng như văn bản, sẽ giúp ích rất nhiều cho vấn đề mô hình thế giới, tức là các mô hình đó cần phải hiểu vật lý của thế giới chúng ta.

Ông cũng cảnh báo rằng áp lực thị trường có thể sẽ đẩy các công ty công nghệ hướng tới sự bí mật hơn là cởi mở với các mô hình AI của họ và “rạp xiếc truyền thông” xung quanh ChatGPT là “hồi chuông cảnh tỉnh” về tiềm năng của các hệ thống AI mạnh mẽ vừa mang lại lợi ích cho xã hội vừa tạo ra những mối lo ngại đáng kể về đạo đức.

gpt-4-sap-trinh-lang-voi-tinh-nang-video-nha-tien-phong-hoc-sau-noi-ve-chatgpt.jpg
Yoshua Bengio nói ChatGPT là “hồi chuông cảnh tỉnh” về tiềm năng của các hệ thống AI mạnh mẽ vừa mang lại lợi ích cho xã hội vừa tạo ra những mối lo ngại đáng kể về đạo đức - Ảnh: Internet

ChatGPT nâng cao nhận thức về tiềm năng của AI

Yoshua Bengio nhấn mạnh rằng ChatGPT dù gây ấn tượng nhưng là bước tiến rất nhỏ về mặt khoa học. Ông nói chatbot của công ty khởi nghiệp OpenAI (Mỹ) “phần lớn là một bước tiến kỹ thuật”.

Yoshua Bengio giải thích rằng ChatGPT có ý nghĩa quan trọng hơn từ quan điểm xã hội, nghĩa là làm cho nhiều người nhận thức được những gì có thể được làm với AI. Tuy nhiên, Yoshua Bengio cảnh báo rằng quyết định về cách thiết kế những cỗ máy này từ quan điểm đạo đức và trách nhiệm là tùy thuộc vào con người.

Liệu chúng ta sẽ xây dựng những hệ thống giúp có một cuộc sống tốt đẹp hơn theo nghĩa triết học, hay nó sẽ chỉ là công cụ của quyền lực và lợi nhuận?”, Yoshua Bengio đặt câu hỏi.

Sự cần thiết của quy định

Yoshua Bengio nói rằng trong hệ thống kinh tế và chính trị của chúng ta “câu trả lời đúng cho vấn đề này là quy định”, đồng thời chỉ ra rằng các công ty khởi nghiệp sẵn sàng chấp nhận rủi ro khiến những hãng công nghệ lớn hơn như Google và Microsoft cảm thấy bắt buộc phải tham gia cuộc đua.

Theo Yoshua Bengio, “bảo vệ công chúng về lâu dài là điều tốt cho tất cả mọi người và tạo sân chơi bình đẳng, thế nên những công ty sẵn sàng chấp nhận rủi ro hơn với sức khỏe của công chúng sẽ không được khen thưởng vì đã làm điều đó”.

Ông nhấn mạnh rằng có những cuộc thảo luận xung quanh việc đảm bảo quy định về AI không gây tổn hại cho nền kinh tế đổi mới. “Nó sẽ làm chậm lại một số thứ, nhưng đó có lẽ là một điều tốt”, Yoshua Bengio nói.

Cái nhìn dài hạn về ChatGPT và LLM

Yoshua Bengio thừa nhận rằng tại thời điểm này, các công ty đang cảm thấy cấp bách đưa ChatGPT và các mô hình ngôn ngữ lớn (LLM) khác vào các sản phẩm, dịch vụ của họ. Thế nhưng, ông chỉ ra rằng các học giả và một số công ty cũng đang có một tầm nhìn xa hơn về những gì xảy ra tiếp theo.

Làm thế nào để chúng ta trở thành công ty lớn tiếp theo trong lĩnh vực này? Làm thế nào để chúng ta lãnh đạo? Để làm được điều đó, bạn phải suy nghĩ về những gì còn thiếu, các tình huống thất bại là gì. Loại nghiên cứu đó rất khó và có thể mất nhiều năm để trả lời. Hy vọng một số người sẽ có tầm nhìn xa hơn so với sự hoảng loạn ngay lúc này”, Yoshua Bengio cho biết.

Trong sự kiện có tiêu đề AI in Focus - Digital Kickoff hôm 10.3, Andreas Braun - CTO của Microsoft Đức cho biết: “Chúng tôi sẽ giới thiệu GPT-4 vào tuần tới. Ở đó, chúng tôi sẽ có các mô hình đa phương thức nhằm cung cấp các tính năng hoàn toàn khác nhau, ví dụ như khả năng tạo video”.

Điều này có nghĩa Bing sẽ được nâng cao hơn trong việc tìm kiếm thông tin và hiển thị kết quả nhanh hơn nhờ GPT-4.

Hiện tại, các giải pháp AI của OpenAI cho phép mọi người tương tác thông qua các kiểu nhập văn bản. Giờ đây, GPT-4 được xác nhận là có khả năng đa phương thức, giúp người dùng tương tác qua nhiều chế độ, bao gồm văn bản, hình ảnh và âm thanh.

gpt-4-sap-trinh-lang-voi-tinh-nang-video-nha-tien-phong-hoc-sau-noi-ve-chatgpt2.jpg
GPT-4 cho phép người dùng tương tác qua nhiều chế độ, bao gồm văn bản, hình ảnh và âm thanh

Đây không phải là lần đầu tiên thông tin về GPT-4 được đưa ra cũng như khả năng tạo video của nó. Hồi tháng 2, rộ tin OpenAI đang làm việc trên ứng dụng di động ChatGPT sẽ được hỗ trợ bởi GPT-4, trong đó tạo video với AI là một trong những tính năng nổi bật.

Ngoài ra, GPT-4 sẽ tạo câu trả lời nhanh hơn so với GPT-3.5 hiện có và nghe giống con người hơn. Tất cả những thay đổi này cũng sẽ có trong Bing chatbot thời gian tới.

Andreas Braun không đề cập cụ thể đến Bing chatbot và khi nào công cụ này bắt đầu nhận được các lợi ích từ GPT-4. Song với thực tế là Microsoft đã đầu tư hàng tỉ USD vào OpenAI nên không mất nhiều thời gian để đưa GPT-4 vào Bing chatbot.

Nhiều người trong thế giới công nghệ đang hồi hộp chờ đợi OpenAI phát hành GPT-4, phiên bản mạnh mẽ hơn của công nghệ chạy ChatGPT. Thế nhưng, Mira Murati - CTO OpenAI muốn thế giới bớt kỳ vọng một chút.

"Tôi nghĩ ít cường điệu sẽ tốt hơn", Mira Murati nói với tạp chí Fast Company khi được hỏi về GPT-4.

Trang The Verge đưa tin các chuyên gia AI và các nhân vật ở Thung lũng Silicon cho rằng GPT-4 sẽ là một bước tiến lớn, vì họ tin rằng phiên bản sẽ được đào tạo trên hàng trăm tỉ thông số (hoặc điểm dữ liệu), nhiều hơn so với GPT-3. Các thông số này sẽ cho phép AI thu thập nhiều dữ liệu hơn từ internet và về mặt lý thuyết giúp nó chính xác hơn.

Một số người thậm chí còn tin rằng GPT-4 có thể dẫn đầu về generative AI. Thế nhưng, Sam Altman - Giám đốc điều hành (CEO) OpenAI đã dập tắt tin đồn đó.

Khi được hỏi trong một cuộc phỏng vấn về biểu đồ so sánh giữa hàng tỉ tham số của GPT-3 với hàng ngàn tỉ tham số được cho của GPT-4, Sam Altman nói rằng điều đó là "hoàn toàn nhảm nhí". "Tin đồn về GPT-4 là điều lố bịch. Mọi người đang kỳ vọng quá lớn và họ sẽ thất vọng", Sam Altman cho biết trong cuộc phỏng vấn.

Bất chấp những lời đồn đoán, Mira Murati nói rằng GPT-4 có thể "mở rộng cơ hội cho mọi người".

Đề cập đến những tranh cãi xung quanh việc sử dụng ChatGPT trong trường học, Sam Altman cho rằng GPT-4 sẽ biến những giáo viên tin rằng ChatGPT khuyến khích gian lận và đạo văn thành những người vui vẻ, có thể sử dụng chatbot này như công cụ để giúp soạn giáo án.

"Với ChatGPT, bạn có thể có sự tương tác vô hạn và nó sẽ dạy bạn về các chủ đề phức tạp dựa trên ngữ cảnh của bạn. Nó giống như một gia sư cá nhân", Mira Murati chia sẻ.

Chỉ một tháng sau khi được tích hợp chatbot AI, Bing đã vượt mốc 100 triệu người dùng truy cập hàng ngày. Thông tin này được Yusuf Mehdi (Phó chủ tịch mảng Đời sống hiện đại, Tìm kiếm và Thiết bị của Microsoft) tiết lộ hôm 9.3. Dù Yusuf Mehdi cho rằng đó vẫn chỉ là một con số nhỏ, nhưng là thành tích đáng kể với Bing.

Sự tăng trưởng của Bing nhờ tích hợp chatbot AI mà Microsoft vừa giới thiệu vào tháng trước. Điều đó đã kích thích người dùng tò mò tiến hành thử nghiệm việc tìm kiếm. Theo Yusuf Mehdi, 1/3 trong số người dùng truy cập hàng ngày vào Bing là người dùng mới. Sự kết hợp của “Tìm kiếm, Câu trả lời, Trò chuyện và Sáng tạo” trong một trải nghiệm tìm kiếm đã mang đến sức hút thực sự cho Bing phiên bản mới.

Microsoft cũng ghi nhận Bing nhận được sự gia tăng về mức độ tương tác khi nhiều người thực hiện việc tìm kiếm hơn. Microsoft đưa ra hai lý do cho sự tăng trưởng này là tăng mức độ sử dụng trình duyệt Edge được bổ sung tính năng chatbot AI của Bing và mô hình Prometheus AI giúp cho kết quả tìm kiếm với Bing phù hợp hơn khiến người dùng thích sử dụng hơn.

Cũng theo báo cáo, khoảng 1/3 người dùng được trải nghiệm Bing phiên bản mới đã sử dụng chatbot AI cho các truy vấn của họ mỗi ngày. Trung bình, Microsoft ghi nhận có ba cuộc trò chuyện mỗi phiên, với hơn 45 triệu cuộc trò chuyện kể từ khi Bing phiên bản mới được giới thiệu. Hơn nữa, trong 15% tất cả phiên trò chuyện, người dùng đã sử dụng Bing để tạo nội dung mới. Việc ra mắt chatbot AI của Bing trên thiết bị di động cũng đã giúp thúc đẩy công cụ tìm kiếm này lên một mức độ phổ biến mới, dẫn đến số người dùng hoạt động hàng ngày tăng gấp 6 lần so với trước đó.

Thông qua việc tích hợp chatbot AI vào Bing, Microsoft đã cung cấp cho công cụ tìm kiếm của mình vũ khí cần thiết để cạnh tranh với Google. Alphabet (công ty mẹ của Google) ra mắt chatbot AI riêng có tên Bard hôm 6.2 nhưng gây thất vọng khi cung cấp các thông tin sai lệch trong video quảng cáo, dẫn đến vốn hóa thị trường mất hơn 100 tỉ USD.

AI làm, ai chịu?


 0

ChatGPT được cánh lập trình dạy cho học “cách làm người” dựa vào kho văn bản khủng trên internet. Chatbot này có thể tạo ra ngôn ngữ mà khi dùng có cảm giác đang đối thoại với vật thể lạ ngoài hành tinh đã biết hết về trái đất như trong phim viễn tưởng.

Rất nhiều lĩnh vực của đời sống sẽ dùng AI hoặc bị ảnh hưởng bởi AI như thế giới đang bị internet thống trị. Ảnh: TL


Trong hai thế kỷ qua, máy hơi nước rồi điện đến máy tính và internet là những tiến bộ công nghệ phá vỡ thị trường lao động, làm cho một số người mất việc nhưng lại tạo ra những công việc mới. Tuy vậy, máy tính thông minh nhất vẫn chưa thực sự biết tất cả mọi thứ như con người, trí tuệ nhân tạo (AI) vẫn chứa đựng những sai sót vì bản chất vẫn là mô hình xác suất được thống kê xử lý trên dữ liệu cực lớn.

Dẫu sao, AI kiểu ChatGPT đã đạt đến điểm uốn, sẽ tác động lên xã hội chứ chưa cần đợi đến khi AI được hoàn thiện.

Nghề viết thay đổi thời @, sẽ thay đổi chóng mặt thời AI

Khi làm cho World Bank (WB) bên Mỹ từ năm 2004, tôi đã nghĩ khi về hưu mình sẽ làm gì. Có một thứ có thể thử là viết báo. Khi làm việc ở Hà Nội thì văn phòng WB đã kết nối internet trước cả khi Việt Nam mở cổng (1997), tôi đã lướt internet và tìm ra nhiều thông tin bổ ích. Nhớ khi đó có cuộc chiến giữa hai trình duyệt Netscape Navigator và Internet Explorer. Nhờ có thông tin online mà tôi biết được khá nhiều nên đã bắt đầu viết cho tờ báo Đầu tư nước ngoài của Bộ Kế hoạch và Đầu tư, được tòa soạn coi là nguồn đáng tin, và tôi cũng chứng kiến nghề viết báo thay đổi ra sao.

Năm 1989 có world wide web nhưng người dùng không thể lướt mạng như bây giờ vì chưa có phương thức “duyệt” chung. Công ty Netscape Communications với trình duyệt Netscape Navigator 1.0 ra đời năm 1994, người dùng thương mại phải mua với giá 99 USD/người hoặc mua cái đĩa cài Netscape với giá khoảng 40 USD. Khi đó Netscape không có đối thủ, sự rúng động thị trường công nghệ thông tin (IT) mạnh mẽ không khác ChatGPT hôm nay.

Nhưng rồi Internet Explorer 1.0 (IE) tích hợp trong Windows 95 của Microsoft ra đời vài ngày sau đó và vài năm sau không còn ai nói đến Netscape! Tương tự như ChatGPT và Google đang ngấm ngầm thư hùng hôm nay, chưa rõ ai sẽ biến đi hay cùng chung sống.

IT đã thay đổi nhiều thứ. Karaoke thách thức ca sĩ vì bất kỳ ai cũng thành ca sĩ vườn, internet thách thức nhà báo vì mỗi công dân có thể thành người đưa tin được gọi một cách sang trọng là “nhà báo công dân”. 

Dựa vào AI hoàn toàn sẽ dễ bias (thiên kiến), nhiều lúc vô nghĩa, hoặc bị thuyết âm mưu dẫn dắt. Ảnh minh hoạ: PhonlamaiPhoto


Ngày xưa báo in, mỗi bài viết chỉ có số lượng chữ nhất định, vì thế lượng tin ít hơn. Internet ra đời, báo online xuất hiện thách thức báo in. Rồi băng thông rộng, tin tức đa phương tiện, blog, facebook, các nhà báo công dân tiếp tục đẩy báo online và báo in vào chân tường. Đó là chưa kể những lời vàng thước ngọc trên bục cao không còn thiêng như xưa bởi người nghe có internet để kiểm chứng, so sánh và chất vấn.

Internet giúp tôi, một công chức bình thường thành người viết blog và viết báo kể cả lúc về hưu. Trong nghề này, viết gì thường cần có ý tưởng. Tôi thường dùng Google để kiểm tra thông tin, tìm tin, xem ảnh trước khi viết bài. Với tôi, không có internet thì tôi chịu không viết nổi vì cảm giác mình mất cái nền, bí khái niệm hay sự kiện nào cũng tra Google, không nhớ từ Việt viết “sờ nặng (S)” hay “sờ nhẹ (X)” thì “sờ” chị “Gúc”.

Giờ thêm ChatGPT, tôi tin sẽ tiện hơn và nhanh hơn do AI gợi ý. Đương nhiên mình phải có ý tưởng riêng nhưng gợi ý sẽ quan trọng. Tuy nhiên dựa vào AI hoàn toàn sẽ dễ bias (thiên kiến), nhiều lúc vô nghĩa, hoặc bị thuyết âm mưu dẫn dắt. Hơn nữa, bạn viết cũng có công cụ AI tương tự, nếu tác giả không có sáng tạo sẽ có những bài báo rập khuôn kiểu văn mẫu, đồng phục, độc giả sẽ nhận ra ngay là người máy viết.

AI có thể thay đổi nghề y

Thỉnh thoảng tôi đi khám mắt chỗ bác sĩ nhãn khoa L.Q. Khi tra tên thuốc, tìm triệu chứng lâm sàng, xem kết quả xét nghiệm máu, chị thường vào mạng để tìm kiếm, so sánh, có lúc tham vấn đồng nghiệp cho chắc rồi mới phán bệnh và kê đơn. Chị bảo, làm bác sĩ thời nay đỡ vất vả hơn nhiều do có những trang dành cho y khoa rất chuyên nghiệp, tìm thông tin nhanh chóng, kết hợp với kinh nghiệm của mình, chẩn đoán lâm sàng nhanh hơn để có bước đi thích hợp. Nhưng cũng là thách thức vì bạn nghề cũng có công cụ tương tự.

Tạo ứng dụng AI trong y học không quá khó vì cánh lập trình sử dụng các thuật toán và phần mềm dạy máy tính để mô phỏng nhận thức của con người trong phân tích, trình bày, hiểu dữ liệu phức tạp về y tế và chăm sóc sức khỏe. AI có khả năng dựa vào thuật toán để chẩn đoán bệnh gần đúng dựa trên dữ liệu đầu vào do bác sĩ cung cấp. Thuật toán nhận dạng ảnh ngày càng hoàn thiện thì việc có bức ảnh MRI (nhiều chiều) chụp não hay xương cổ gáy đưa vào AI sẽ có ngay lời phán khá chính xác và nhất quán nếu AI được dạy chu đáo về “đọc ảnh”. 

IT, internet, aI sẽ tiếp tục thay đổi thế giới mà hệ quả của nó là do người dùng chứ AI vô hồn nên chả biết đúng sai.

Dân IT đang hoàn thiện các thuật toán dạy máy tính (machine learning), xử lý ngôn ngữ tự nhiên kiểu chatbot, Rule-based Expert Systems - hệ thống chuyên gia dựa trên quy tắc, ứng dụng chẩn đoán và điều trị. Tuy nhiên sẽ có những thách thức không nhỏ vì AI cần truy cập kho dữ liệu khổng lồ để mang lại hiệu quả nhưng dữ liệu của bệnh nhân không thể đưa vào kho chung một cách dễ dàng. Thêm vào đó, nếu dữ liệu để dạy máy (hệ chuyên gia) lại dựa vào thông tin không chính xác, sai lệch hay thiên kiến thì dễ tạo ra “bác sĩ máy” toàn lỗi lầm. 

Thách thức lớn nhất đối với AI trong y học không phải là dân IT có thể lập trình các ứng dụng AI đủ thông minh hay không mà là việc áp dụng AI trong thực hành lâm sàng. Theo thời gian AI sẽ thông minh dần lên, bác sĩ có thể chuyển sang các nhiệm vụ đòi hỏi kỹ năng độc đáo của con người mà người máy “bó tay” hay công việc đòi hỏi mức độ có chức năng nhận thức cao nhất. 

Các nhà nghiên cứu của OpenAI đã lo lắng về việc chatbot rơi vào tay kẻ xấu. Ảnh: ScreenRant/Zing


Tác động lên xã hội

Rất nhiều lĩnh vực của đời sống sẽ dùng AI hoặc bị ảnh hưởng bởi AI như thế giới đang bị internet thống trị. Theo một số chuyên gia AI nổi tiếng thì có vài ý về sự bùng nổ nhân chuyện ChatGPT và cần hiểu cho đúng về AI như sau: (1) sáng tạo cho tất cả - nhưng con người sẽ mất kỹ năng; (2) tiềm ẩn sự không chính xác, thành kiến và đạo văn; (3) vượt qua con người về nhiều mặt nhưng những công việc thích hợp và “thủ công” vẫn còn; (4) công việc này cũ đi thì công việc mới sẽ xuất hiện; (5) những bước nhảy vọt trong công nghệ dẫn đến các kỹ năng mới. 

Theo dõi dư luận những ngày gần đây thấy nhiều ý kiến cho rằng AI cải thiện chất lượng cuộc sống bằng cách thực hiện các công việc thường ngày và thậm chí phức tạp tốt hơn con người, giúp cuộc sống trở nên đơn giản, an toàn và hiệu quả hơn. Nhưng một số khác cho rằng AI gây ra những rủi ro nguy hiểm về quyền riêng tư, làm trầm trọng thêm nạn phân biệt chủng tộc hay lý lịch bằng cách tiêu chuẩn hóa con người và khiến người lao động mất việc làm, dẫn đến tỷ lệ thất nghiệp lớn hơn. 

Mỗi khi thế giới có công nghệ mới mang tính đột phá thì tranh cãi là đương nhiên. Nobel từng hối tiếc, giá như ông đừng nghĩ ra thuốc nổ. Nhưng ông không sáng tạo thì người khác sẽ làm. Vấn đề dùng thuốc nổ như thế nào là do con người, đôi lúc bảo vệ hòa bình cũng cần sức công phá.

“Cha đẻ” của AI - John McCarthy, đã đặt ra thuật ngữ “trí tuệ nhân tạo” khi ông cùng với Marvin Minsky và Claude Shannon, đề xuất một hội thảo mùa hè năm 1956 về chủ đề này tại Đại học Dartmouth (Mỹ) với định nghĩa AI là “khoa học và kỹ thuật chế tạo máy móc thông minh”. Sau đó, ông đã tạo ra ngôn ngữ lập trình máy tính LISP (hiện vẫn được sử dụng trong AI), tổ chức các trò chơi cờ vua máy tính chống lại các đối thủ cờ Nga và phát triển máy tính đầu tiên có khả năng “tay-mắt” như người.

Hơn bốn thập kỷ sau, vào năm 1997, Gary Kasparov, vô địch thế giới môn cờ vua đã bị hạ gục bởi siêu máy tính IBM Deep Blue được lập trình bởi các chuyên gia hàng đầu về AI. Những tiến bộ về giới hạn và tốc độ lưu trữ máy tính đã mở ra những con đường mới cho nghiên cứu và triển khai AI, như hỗ trợ nghiên cứu khoa học và tạo ra những hướng mới trong y học như đã nói.

IT, internet, AI sẽ tiếp tục thay đổi thế giới mà hệ quả của nó là do người dùng chứ AI vô hồn nên chả biết đúng sai.

Giá như hỏi ChatGPT về tương lai của chính nó, AI sẽ bảo “I don’t know - Tui hổng biết!”. 

Hiệu Minh

 

ChatGPT sắp có bản cập nhật làm đảo lộn thế giới công nghệ

Phiên bản tiếp theo của ChatGPT có khả năng tạo video, hình ảnh, âm nhạc dựa vào một số từ khóa gợi ý, hứa hẹn gây ra cơn sốt mới trên thị trường công nghệ toàn cầu.

ChatGPT sẽ như "hổ mọc thêm cánh" với khả năng tạo video từ văn bản. Ảnh: Future.

ChatGPT sẽ như "hổ mọc thêm cánh" với khả năng tạo video từ văn bản. Ảnh: Future.

Các tính năng nâng cao của ChatGPT, chẳng hạn như gỡ lỗi mã lệnh, viết bài luận hoặc kể một câu chuyện cười, khiến chatbot AI này nhanh chóng gây tiếng vang trên toàn cầu. Chưa dừng lại ở đó, OpenAI sẽ tiếp tục nâng cấp sản phẩm nổi tiếng nhất của họ.

Tại sự kiện AI in Focus - Digital Kickoff, Andreas Braun, Giám đốc Công nghệ Microsoft chi nhánh Đức, tiết lộ phiên bản GPT-4 sẽ xuất hiện trong tuần tới, mang khả năng tạo video từ văn bản lên ChatGPT.

"Chúng tôi sẽ giới thiệu GPT-4 vào tuần tới. Ở đó, sẽ có các mô hình đa phương thức, cung cấp những khả năng hoàn toàn khác nhau, ví dụ như video", ông cho biết.

ChatGPT hoạt động trên kiến ​​trúc mô hình ngôn ngữ lớn (LLM) do OpenAI tạo ra có tên Generative Pre-training Transformer (GPT), cụ thể là GPT-3 hoặc GPT-3.5. Giới hạn của chatbot này hiện tại là chỉ xuất nội dung dưới dạng văn bản.

GPT-4 sẽ là AI đa phương thức, có thể tạo nội dung dưới nhiều hình thức khác nhau, không còn giới hạn như trước. Holger Kenn, Giám đốc Chiến lược Kinh doanh của Microsoft Đức, cho biết AI mới có thể dịch văn bản thành video, nhạc và hình ảnh.

Trình tạo văn bản thành video không phải là một khái niệm hoàn toàn mới. Những gã khổng lồ công nghệ như Meta và Google từng phát triển thành công các mô hình như vậy.

Meta có Make-A-Video và Google sở hữu Imagen Video. Cả 2 sử dụng AI để tạo video từ gợi ý đầu vào của người dùng. Tuy nhiên, công nghệ của Meta và Google vẫn trong giai đoạn nghiên cứu, chưa cung cấp rộng rãi. Điều này đặt OpenAI vào vị trí hoàn hảo để dẫn đầu cuộc cạnh tranh trên thị trường AI tạo sinh.

Microsoft đầu tư rất nhiều vào OpenAI, nhà sản xuất ChatGPT. Họ hợp tác chặt chẽ với nhau để cải thiện nền tảng AI. Việc Braun thảo luận về GPT-4 tại một sự kiện của Microsoft cho thấy 2 công ty đang có mối liên hệ mật thiết.

Vào tháng 2, Microsoft ra mắt phiên bản công cụ tìm kiếm Bing mới, tích hợp trí tuệ nhân tạo nền tảng của OpenAI. Đó là một bước đi táo bạo nhằm giành lấy lưu lượng truy cập từ đối thủ Google, vốn đang thống trị thị trường.

Chỉ một tháng sau, có hàng triệu người đăng ký vào danh sách chờ duyệt dùng thử Bing mới, thúc đẩy số người dùng công cụ tìm kiếm này vượt qua 100 triệu, cột mốc Microsoft chưa từng chạm đến.