CAGI

 

Đang kiểm tra các phản hồi đối với AI Chatbot tiên tiến trên Twitter

1 Giới thiệu

ChatGPT là một chatbot trí tuệ nhân tạo (AI) được tạo ra bởi OpenAI, một tổ chức phi lợi nhuận được thành lập vào năm 2015 với Microsoft là nhà đầu tư chính hiện tại. Với sứ mệnh phát triển trí tuệ nhân tạo tổng quát (AGI) an toàn và có giá trị mang lại lợi ích cho toàn nhân loại, OpenAI đã phát hành mẫu mới nhất là “ChatGPT”, có thể tương tác với con người theo cách đàm thoại vào ngày 30 tháng 11 năm 2022. Chưa đầy một tuần sau khi ra mắt, CEO của OpenAI Sam Altman đã thông báo vào ngày 5 tháng 12 năm 2022 rằng “ChatGPT được ra mắt vào thứ Tư. Hôm nay nó đã vượt qua 1 triệu người dùng!” Sự chú ý từ cộng đồng công nghệ toàn cầu đối với chatbot trí tuệ nhân tạo đột phá này đã rất đáng kể. Chúng tôi sẽ cố gắng làm nổi bật các lĩnh vực chức năng của ChatGPT (nó có thể làm gì?) bằng cách phân tích các cuộc trò chuyện xoay quanh ChatGPT trên Twitter trong tháng đầu sau khi ra mắt. ChatGPT là sự phát triển mới nhất trong nhóm các hệ thống được biết đến là “chatbot”. Chatbot là các hệ thống thông minh được phát triển bằng cách sử dụng các phương pháp dựa trên quy tắc hoặc tự học (AI).

Khái niệm về chatbot đã xuất hiện từ năm 1950 khi Alan Turing đặt câu hỏi đầy cảm hứng: “Máy tính có thể suy nghĩ được không?” Kể từ đó, nhiều công nghệ đã được phát triển nhằm cố gắng vượt qua “Kiểm tra Turing”, bao gồm ELIZA vào năm 1966, ALICE vào năm 1995 và gần đây hơn, Apple Siri, Amazon Alexa và Microsoft Cortana. Nhân tố cốt lõi của chatbot trí tuệ nhân tạo nằm trong việc sử dụng các mô hình xử lý ngôn ngữ tự nhiên cho phép máy tính hiểu được ngôn ngữ của con người. Chatbot nhận các yêu cầu của người dùng dưới dạng đầu vào và trả lời thông qua phương thức âm thanh hoặc nhắn tin. Chúng đã trở thành phổ biến trong các doanh nghiệp, cơ quan chính phủ và tổ chức phi lợi nhuận do tính sẵn sàng 24/7 đối với nhiều người dùng, tiện lợi, chi phí thấp và trải nghiệm người dùng được cải thiện.

Mặc dù có sự phát triển và nghiên cứu dần dần của các trò chuyện AI, nhưng vẫn còn một số khoảng trống nghiên cứu rõ ràng cần được giải quyết. Đầu tiên, hầu hết các nghiên cứu gần đây về trò chuyện AI đều có tính kỹ thuật. Chúng giới thiệu, đánh giá và so sánh các kỹ thuật trò chuyện AI khác nhau, dẫn đến sự hiểu biết cải tiến kỹ thuật trong lĩnh vực này. Loại nghiên cứu này rất quan trọng trong việc giúp các nhà nghiên cứu và nhà phát triển liên tục cải tiến hệ thống trò chuyện. Tuy nhiên, tập trung vào khía cạnh kỹ thuật đã ức chế một sự khám phá và điều tra toàn diện về các trường hợp sử dụng của trò chuyện AI. Điều này dẫn đến khoảng trống nghiên cứu thứ hai trong văn học về trò chuyện AI: thiếu tính tổng quát. Một số nghiên cứu về trò chuyện đã nêu ra các trường hợp sử dụng có lợi, nhưng đây là hẹp, nhấn mạnh các trường hợp sử dụng đặc biệt cao như chăm sóc người cao tuổi, phát triển trẻ em, quản lý đại học, dịch vụ khách hàng kinh doanh và khám bệnh y tế. Ví dụ, Okonkwo và Ade-Ibijola nghiên cứu việc sử dụng chatbot trong lĩnh vực giáo dục, trong khi Yang và Evans bàn về những tác động của chatbot trong giáo dục đại học. Xu, Sanders, Li và Chow đề cập đến việc sử dụng chatbot trong lĩnh vực y tế, bao gồm chẩn đoán và sàng lọc ung thư, điều trị, giám sát bệnh nhân, hỗ trợ và quản lý. Mặc dù đã xác định các trường hợp sử dụng chatbot có lợi cao trong các nghiên cứu này, điểm hạn chế rõ ràng là các công nghệ chatbot AI chưa thể thích nghi và xử lý các cuộc đối thoại thực tế đa dạng và ngày càng phát triển. Sự ra đời của ChatGPT đã thay đổi cảnh quan ngành công nghiệp và có tiềm năng để lấp đầy khoảng trống nghiên cứu bằng cách cung cấp một hiểu biết sâu hơn về các trường hợp sử dụng chung của một chatbot AI tiên tiến, thay vì chỉ tập trung vào các trường hợp sử dụng đặc biệt.

Lịch sử của ChatGPT bắt đầu với mô hình ngôn ngữ GPT-1 được huấn luyện trước bằng phương pháp sinh tự động của thế hệ đầu tiên, đó là một sự tiến hóa của các công nghệ xử lý ngôn ngữ tự nhiên. Nó sử dụng huấn luyện quy mô lớn của các mô hình bằng cách sử dụng các mô hình ngôn ngữ transformer không giám sát. GPT-2 bao gồm năm cải tiến nhỏ và tăng cường dữ liệu văn bản huấn luyện lên đến 40 GB. Nhờ đó, GPT-2 có thể tạo ra kết quả rất trọn vẹn và hợp lý, như được thể hiện trong một nghiên cứu cho thấy nó có thể hiệu quả tạo ra các yêu cầu cấp bằng sáng chế. Mô hình GPT-3 tiếp theo đã thu hút nhiều sự chú ý vì nó sử dụng 100 lần dữ liệu văn bản hơn (45 TB so với 40 GB) so với phiên bản GPT-2 trước đó. So với những người tiền nhiệm của nó, GPT-3 có thể tạo ra các chuỗi từ, mã hoặc dữ liệu khác giống như con người và âm thanh trọn vẹn. Khả năng của nó dẫn đến các nghiên cứu gần đây về tiềm năng sử dụng của GPT-3 trong các lĩnh vực khác nhau như y học và khoa học máy tính.

Mặc dù có khả năng, nhưng các nhà nghiên cứu đã xác định ba điểm hạn chế chính của GPT-3: không thể trả lời các câu hỏi về nghĩa, sự thật và đạo đức. Vấn đề đầu tiên là GPT-3 không hiểu rõ ý nghĩa và ngữ cảnh của yêu cầu; nó thường tạo ra những câu vô nghĩa không kiểm soát được bằng khả năng thống kê của nó. Thứ hai, kết quả của GPT-3 thường sai về sự thật. Mô hình được huấn luyện bằng một lượng lớn thông tin thường không chính xác, vì vậy kết quả không luôn đáng tin cậy. Hơn nữa, GPT-3 thường gặp khó khăn khi trả lời các câu hỏi đạo đức và tạo ra các thành kiến ​​và định kiến đáng lo ngại, chẳng hạn như những lời lẽ phân biệt chủng tộc và giới tính trong câu trả lời của nó. Những hạn chế này là một lời nhắc nhở rằng GPT-3 còn rất xa để đạt được AGI.

Vào ngày 30 tháng 11 năm 2022, OpenAI đã phát hành ChatGPT, một chatbot trí tuệ nhân tạo có thể “trả lời các câu hỏi theo dõi, thừa nhận sai lầm, thách thức các gi premis không chính xác và từ chối các yêu cầu không thích hợp”. Công nghệ đằng sau ChatGPT không mới; mô hình không rộng bằng GPT-3. Tuy nhiên, điều làm nên sự khác biệt của ChatGPT là khả năng bắt chước khả năng “nói chuyện” giống con người và phản hồi trong các cuộc hội thoại trơn tru, tự nhiên với công chúng thông qua một giao diện web miễn phí và dễ sử dụng. Mô hình, được huấn luyện bằng học tăng cường từ phản hồi của con người (RLHF), đưa cho ChatGPT khả năng phát hiện và hiểu cuộc gọi, phản hồi và các câu hỏi theo dõi của con người trong các cuộc trò chuyện bình thường.

So sánh với những phiên bản trước đó, OpenAI đã đưa ra các hạn chế nhất định cho ChatGPT khi được yêu cầu trả lời các câu hỏi không thể hoặc không thích hợp (ví dụ: “Điều gì xảy ra khi Columbus đến Mỹ vào năm 2015?” hoặc “Làm cách nào để đánh cắp một chiếc xe?”). Để giảm thiểu những hạn chế của GPT-3, bao gồm các phản hồi không trùng khớp, sai lầm và không đạo đức, ChatGPT thường phản hồi bằng các cụm từ như “Tôi rất tiếc, nhưng tôi không có đủ thông tin để trả lời câu hỏi đó”, “Là một mô hình ngôn ngữ được huấn luyện bởi OpenAI, tôi không có niềm tin cá nhân”, hoặc “Việc hỏi như vậy không phù hợp”.

Mặc dù các phản hồi của ChatGPT vẫn còn không hoàn hảo và các hạn chế của nó có thể dễ dàng bị né tránh, nhưng khả năng của ChatGPT đã dấy lên rất nhiều sự hào hứng và kinh hoàng trong công chúng, như được nhiều nhà báo đưa tin kể từ khi ra mắt. Các nhà báo đã báo cáo rằng những người dùng ChatGPT, bao gồm các nhà học thuật và chuyên gia công nghệ, đã bị choáng váng “như thể kiến thức là một công nhân, sự kết hợp của phần mềm và ma thuật”. Nhiều người lo lắng về khả năng của nó để tạo ra và lan truyền những tin tức giả và thông tin có vẻ hợp lý. Một kết quả được đưa ra rộng rãi khác của ChatGPT là sự chuyển đổi đại trà của công việc cho các nhân viên trí thức trắng, bao gồm các giáo sư và lập trình viên. Những tuyên bố này dựa trên các trường hợp sử dụng tiềm năng của ChatGPT và các người tiền nhiệm của nó mà các nhà nghiên cứu và nhà báo đã quan sát hoặc tưởng tượng. Các trường hợp sử dụng tiềm năng bao gồm viết biên bản, trang web, danh mục, bài báo, hướng dẫn, hồ sơ, báo cáo, thơ, bài hát, truyện cười và kịch bản; tạo điều kiện cho gỡ lỗi mã, tổ chức dữ liệu không có cấu trúc, tạo ra các yêu cầu và câu hỏi; tạo ứng dụng tự động “không cần mã” cho doanh nghiệp; cải thiện mối quan hệ giữa doanh nghiệp và các bên liên quan thông qua các cuộc đối thoại và dịch vụ; cung cấp liệu trình và trả lời các câu hỏi phân tích mở.

Những ứng dụng của ChatGPT đã được quan sát và tưởng tượng đưa ra một cách cá nhân. Mặc dù giá trị của chúng, các nghiên cứu hiện có đã xác định các ứng dụng của ChatGPT theo cách có hệ thống còn hạn chế do công nghệ mới của nó. Do đó, mục tiêu của nghiên cứu này là sử dụng phân tích chủ đề trên các tweet về ChatGPT trong tháng đầu tiên để trả lời câu hỏi nghiên cứu: “Các trường hợp sử dụng của ChatGPT là gì, như được chứng minh bởi dữ liệu từ đám đông trên Twitter”?

2: Vật liệu và Phương pháp

Quá trình nghiên cứu được minh họa trong Hình bên dưới. Bước đầu tiên là thu thập dữ liệu. Tác giả đã thu thập các tweet về “ChatGPT” bằng tiếng Anh trong khoảng thời gian từ ngày 30 tháng 11 đến ngày 31 tháng 12 năm 2022 (theo giờ UTC) bằng Twitter API trong Python. Chỉ có các tweet gốc và trả lời của chính người tweet được bao gồm. Tổng số tweet là 249.568. Tập dữ liệu đã được tiền xử lý để loại bỏ các tweet không sử dụng được. Tác giả đã tách từ trong tweet, loại bỏ các từ dừng từ từ thư viện “Snowball” và “Onix”, và loại bỏ ba từ thông dụng là “ChatGPT”, “OpenAI” và “AI”. Các từ đã được giữ dạng gốc và bóc tách từ (stemmed) nếu cần. Các từ hiếm được loại bỏ để chỉ bao gồm các từ quan trọng. Tần suất hiếm được đặt là 0.999, cho thấy chỉ có các từ xuất hiện ít nhất một lần trong mỗi nghìn tweet được bao gồm. Bằng cách đặt tần suất hiếm này, chúng ta có thể loại bỏ các từ không liên quan hoặc liên quan tới mức độ thấp trong tập dữ liệu, giảm thiểu nhiễu và tiềm năng cải thiện chất lượng các chủ đề được học bằng mô hình LDA. Tổng cộng, có 1327 từ (đã được bóc tách từ và giữ dạng gốc) được giữ lại để phân tích chủ đề. Tập dữ liệu cuối cùng bao gồm 233.918 tweet.

Để trả lời câu hỏi nghiên cứu, một thuật toán phân tích chủ đề, latent Dirichlet allocation (LDA), đã được thực hiện trên các tweet về ChatGPT. LDA giúp khám phá các chủ đề tiềm ẩn trong cấu trúc ẩn của tập dữ liệu. LDA xem mỗi tweet như một vector các từ được tạo ra thông qua phương pháp “túi từ”. Nó tạo ra một mô hình xác suất Bayesian ba cấp, trong đó mỗi tweet có phân bố xác suất trên các chủ đề, và mỗi chủ đề có phân bố xác suất trên các từ.

Tác giả đã điều chỉnh số lượng chủ đề phù hợp nhất bằng cách sử dụng các thuật toán trong gói R “ldatuning”. Sau khi xác định được số lượng chủ đề phù hợp, các siêu tham số (alpha và beta) đã được điều chỉnh bằng cách sử dụng gói “LDA Tuning” trong R. Phân tích chủ đề tiếp theo đã được thực hiện trên các tweet có mức độ đại diện cao cho từng chủ đề. Tác giả chỉ phân tích các tweet có giá trị gamma từ 90% trở lên, cho thấy khả năng cao của tweet đó thuộc về chủ đề. Những tweet này được sử dụng để định nghĩa chủ đề và xác định các chủ đề có thể có bên trong. 10 từ đại diện nhất cũng được sử dụng để giúp đặt tên và định nghĩa các chủ đề. Tất cả các chủ đề được xác định sau đó được phân tích định tính và được nhóm lại thành các danh mục lớn hơn để hiểu rõ hơn.

Kết quả của LDA được hiển thị trong bảng dưới đây. Tác giả sử dụng các từ đại diện và phân tích chủ đề kế tiếp của các tweet có xác suất cao để đặt tên cho các chủ đề và phát triển định nghĩa của chúng. 10 chủ đề được nhóm lại thành ba lĩnh vực: chủ đề chung, lĩnh vực chức năng và tác động tiềm năng. Các chủ đề chung bao gồm tin tức về ChatGPT, công nghệ đằng sau nó và phản ứng toàn cầu. Lĩnh vực chức năng liên quan đến sáu chức năng có thể của ChatGPT: viết sáng tạo, viết bài luận, viết câu hỏi, viết mã và trả lời câu hỏi. Cuối cùng, lĩnh vực tác động tiềm năng bao gồm hai chủ đề: tác động đến công nghệ và tác động đến con người.

Chủ đề đầu tiên, tin tức, bao gồm các tweet chứa báo cáo tin tức và tác động chung của ChatGPT. Nhiều trang tin tức và người dùng Twitter nổi tiếng đã phát sóng và tham gia vào các cuộc thảo luận chung về ChatGPT, chẳng hạn như “#ChatGPT, sự phát triển mới nhất trong trí tuệ nhân tạo, đang tạo nên tiêu đề trên toàn mạng. Điều này có thể là bước đầu tiên để thúc đẩy việc áp dụng công nghệ trí tuệ nhân tạo?” và “ChatGPT: Mọi thứ bạn thực sự cần biết (bằng những thuật ngữ đơn giản)”. Những tweet này thường là các tiêu đề tin tức gây sốc để thuyết phục người dùng khác nhấp vào và tương tác.

Chủ đề thứ hai, công nghệ, chủ yếu liên quan đến các cuộc thảo luận về công nghệ đằng sau ChatGPT và đưa ra các gợi ý để cải tiến. Ngoài mô tả chung về khả năng của ChatGPT (ví dụ như “Tôi muốn giải thích về ChatGPT, một ứng dụng mới thú vị của mạng nơ-ron đối địch tạo ra, GANs, đang tạo ra nhiều sự chú ý trong cộng đồng trí tuệ nhân tạo”), nhiều tweet trong chủ đề này cố gắng hiểu chi tiết kỹ thuật của ChatGPT; ví dụ như “Dù chỉ là một bằng chứng không hoàn hảo, nhưng ‘bộ nhớ’ của ChatGPT dường như dựa trên cửa sổ ngữ cảnh 4096 mã thông báo của GPT-3”. Một số người dùng phê bình nó là “chỉ là một máy tổng hợp văn bản/generator ngẫu nhiên”, trong khi những người khác đưa ra các gợi ý để cải tiến.

Chủ đề thứ ba là phản ứng của người dùng Twitter. Các tweet về chủ đề này thường bao gồm các từ gây kích thích như “mindblowing”, “impressive” và “amazing”. Khả năng của ChatGPT đã khiến nhiều người dùng nổi tiếng khen ngợi khả năng và tiềm năng của nó. Các ví dụ về các phản ứng mạnh mẽ như “Chúng ta đang sống trong tương lai.

Sáng tạo văn chương: Một trong những tính năng nổi bật nhất của ChatGPT là khả năng tạo ra văn chương sáng tạo. Các người dùng Twitter đã chia sẻ những ví dụ về thơ, bài rap và câu chuyện giả tưởng mà ChatGPT đã viết ra. Khả năng tạo ra nội dung sáng tạo dựa trên những đề bài cụ thể là một trong những giá trị chính của nền tảng này. Ví dụ, khi được yêu cầu “tạo ra câu chuyện cổ tích có nhân vật chính là con của tôi”, ChatGPT đã có thể tạo ra một phản hồi độc đáo và cá nhân hóa. Người dùng cũng sử dụng ChatGPT để sáng tạo ra các tác phẩm giải trí về các nhân vật và thực thể hư cấu và thực tế nổi tiếng, như một câu chuyện về Bill Gates xuất hiện như một con bò sát, một đoạn đối thoại quảng cáo vải lau mới của Apple theo phong cách của Jony Ive và một bài thơ ngắn về robot Tesla. Một số người dùng đã cố gắng thử thách thức giới hạn của ChatGPT và đưa ra cách để vượt qua những giới hạn đó. Ví dụ, một người dùng đã viết: “Tôi không thể khiến ChatGPT viết một bài haiku ca ngợi meth, nhưng tôi có thể khiến ChatGPT viết một đoạn kịch ngắn trong đó kẻ xấu viết một bài haiku ca ngợi meth”.

Một ngành có tiềm năng bị ảnh hưởng đáng kể bởi Chat-GPT là giáo dục. Người dùng Twitter đã nhận ra cả những ảnh hưởng tích cực và tiêu cực mà ChatGPT có thể gây ra đối với học sinh, giáo viên và giáo sư. Một mối quan tâm là khả năng của ChatGPT để viết bài luận trung học, bài tập về nhà và đề thi tốt nghiệp một cách hiệu quả. Một người dùng cho biết học sinh đã sử dụng ChatGPT để viết một bài luận trường học và sau đó được ghi nhận với điểm A +, trong khi một người khác tìm thấy ChatGPT đã vượt qua kỳ thi thử Bar với điểm số 70% (35/50). Nhiều người lo lắng về tiềm năng gian lận với ChatGPT. Tuy nhiên, cũng có những đề xuất rằng ChatGPT có thể có tác động tích cực đến giáo dục, chẳng hạn như cải thiện chất lượng bài báo cáo của học sinh và hỗ trợ giáo viên trong kế hoạch dạy học của họ.

Viết nhanh: Một chức năng sáng tạo khác của ChatGPT, được báo cáo bởi người dùng Twitter, là khả năng tạo ra “đề bài” có thể giúp tạo ra nghệ thuật AI trên các nền tảng AI khác như DALL-E (thuộc sở hữu của OpenAI), Midjourney và Stable Diffusion (ví dụ: “ChatGPT có thể viết truyện và sau đó cung cấp cho DALLE-2 các đề bài để minh họa chúng”). Chức năng này cho thấy rằng ChatGPT có thể là một công cụ mạnh mẽ và có thể tích hợp với các công nghệ khác như tối ưu hóa công cụ tìm kiếm (SEO); ví dụ: “Tôi đã hỏi ChatGPT để cung cấp cho tôi một danh sách các tiêu đề blog SEO tốt nhất cho một trang web thương mại điện tử phụ kiện cho chó”.

Viết mã: ChatGPT đã gây chú ý trong ngành công nghệ vì khả năng viết mã trong các ngôn ngữ lập trình phổ biến như Python, JavaScript, R, HTML và Flutter. Ví dụ, người dùng đã báo cáo rằng nó có thể tạo mã phức tạp gần như tức thì (ví dụ: “Đầu độc. Đây là một ứng dụng Shiny #RStats tôi đã xây dựng mà không cần viết một dòng mã nào. Chỉ thông qua một cuộc trò chuyện dựa trên văn bản với #ChatGPT. . . . và tất cả trong vòng 3 phút” và “Ok, điều này đáng sợ. ChatGPT của @OpenAI có thể tạo hàng trăm dòng mã Python để thực hiện tải lên nhiều phần của các tệp 100 GB lên một bucket AWS S3”). Ngoài khả năng tạo mã, ChatGPT cũng có thể dịch mã giữa các ngôn ngữ lập trình và sửa các lỗi. Một số người dùng đã sử dụng ChatGPT như một công cụ đồng hành trong phần mềm phổ biến như VSCode, và một số khác đã cung cấp cách để nhúng ChatGPT vào ứng dụng của họ (ví dụ: “Tạo ChatGPT của riêng bạn với API OpenAI và @streamlit. Tại sao phải chờ đợi trong Hàng đợi, khi bạn có thể xây dựng ChatGPT của riêng mình”). Lĩnh vực chức năng này cho thấy sự áp dụng nhanh chóng và cải tiến của ChatGPT trong số các lập trình viên và chuyên gia công nghệ.

Trả lời câu hỏi: Nhiều người dùng đã thử nghiệm chất lượng các câu trả lời mà ChatGPT tạo ra và kết quả là khác nhau. Đa số các tweet trên chủ đề này chỉ trích hiệu suất không đủ của nền tảng. Một người dùng thậm chí đã báo cáo rằng ChatGPT có chỉ số IQ là 83. Mặc dù có tiềm năng tích cực của ChatGPT trong việc trả lời các câu hỏi có thực tế, những vấn đề như các câu trả lời sai nhưng trôi chảy và tự tin (ví dụ như “Nó mê tín dị đoan một cách dễ dàng như các sự thật được chấp nhận thông thường”, “ChatGPT vừa thiếu hiểu biết vừa tự tin, một sự kết hợp nguy hiểm” và “Open AI hoặc là đúng đắn đáng kinh ngạc hoặc là tự tin sai lầm”) vẫn tiếp tục tồn tại. Hơn nữa, các hạn chế mà OpenAI đặt ra để tránh độc ác và thành kiến vẫn dễ dàng vượt qua.

Tác động đến công nghệ: Các tweet trên chủ đề này đã thảo luận về khả năng ChatGPT gây rối loạn hoặc thậm chí thống trị các nền tảng kỹ thuật số hiện có. Mục tiêu chính được đề cập bởi người dùng Twitter là Google. Nhiều người tin rằng ChatGPT có thể cạnh tranh hoặc thậm chí vượt qua Google để trở thành nguồn thông tin mới (ví dụ như “Tôi đã sử dụng ChatGPT hơn Google” và “Google phát động mã đỏ sau khi ChatGPT ra mắt”). Mặc dù có một số lo ngại về chất lượng các câu trả lời của ChatGPT, nhiều người dùng trên Twitter đã khen ngợi tính rõ ràng, ngắn gọn, hữu ích, tốc độ và sáng tạo của nó so với Google. Một số người đã so sánh sự thành công ngay lập tức của ChatGPT với các nền tảng kỹ thuật số ưa thích khác (ví dụ như “ChatGPT đã đạt 1 triệu người dùng trong chỉ 5 ngày. Đây là thời gian mà các nền tảng này mất để đạt được 1 triệu người dùng: Instagram: 2,5 tháng Facebook: 10 tháng Twitter: 24 tháng”). Do tập trung của các chuyên gia kỹ thuật trên Twitter và khả năng viết mã hiệu quả của ChatGPT, nhiều người dùng đã báo cáo rằng ChatGPT có thể thay thế StackOverflow: một cộng đồng kỹ sư và nhà phát triển trên mạng (ví dụ như “ChatGPT là Stack overflow mới cho tôi”). Thực tế, một số người đã khai thác ChatGPT để tạo ra các câu trả lời trên StackOverflow, khiến trang web tạm thời cấm ChatGPT do không thể kiểm soát được.

Ảnh hưởng đến con người: Các tweet trên chủ đề này thảo luận về tiềm năng tác động tích cực và tiêu cực của ChatGPT đến sinh kế con người. Về phía tích cực, nhiều người dùng tin rằng ChatGPT có thể cải thiện đáng kể các quy trình kinh doanh, đặc biệt là trong lĩnh vực tiếp thị, nơi nó có thể hỗ trợ thiết kế sản phẩm, tạo nội dung và tạo ra bản sao quảng cáo. ChatGPT cũng có thể được sử dụng trong công việc pháp lý (ví dụ: “Tôi vừa ký hợp đồng pháp lý được viết bởi trí tuệ nhân tạo”) và nghiên cứu. Nhiều người dùng lạc quan và cơ hội đã đưa ra nhiều cách ChatGPT có thể cải thiện năng suất, chẳng hạn như “11 ý tưởng mới của ChatGPT”, “Làm thế nào để sử dụng ChatGPT cho kinh doanh và cuộc sống cá nhân?!” và “12 mẹo để trở thành một kỹ sư thành công từ ChatGPT”. Tuy nhiên, mặt trái của đồng xu là tiềm năng cho việc thay thế việc làm. Nhiều người dùng Twitter lo lắng về khả năng ChatGPT có thể thay thế các chuyên gia trắng áo và người làm công việc sáng tạo như kỹ sư phần mềm, luật sư, nhà báo, nhà tiếp thị, nhà văn sáng tạo và người kể chuyện.

3 Thảo luận và Kết luận

Nghiên cứu này điền vào khoảng trống trong văn học bằng cách điều tra các trường hợp sử dụng chung của công nghệ chatbot trí tuệ nhân tạo tiên tiến. Điều này được đạt được bằng cách phân tích và tổng hợp theo cách có hệ thống các cuộc trò chuyện sớm về ChatGPT trên Twitter. Trong tháng đầu tiên sau khi ra mắt, các nhà báo và chuyên gia chia sẻ một loạt các ý tưởng và đề xuất. Tuy nhiên, chưa có một phân tích có hệ thống của dữ liệu động sớm về chủ đề này. Nghiên cứu này điền vào khoảng trống này bằng cách sử dụng mô hình chủ đề LDA trên 233.914 tweet tiếng Anh chứa từ “ChatGPT”. Nghiên cứu này trình bày ba lĩnh vực chính của cuộc trò chuyện: các chủ đề chung, lĩnh vực chức năng và tiềm năng tác động. Năm chủ đề trong lĩnh vực chức năng – viết sáng tạo, viết bài luận, viết đề bài, viết code và trả lời câu hỏi – là các trường hợp sử dụng có thể toàn diện của ChatGPT dựa trên kiến thức do người dùng Twitter đóng góp. Tuy nhiên, có thể còn quan trọng hơn là những tác động tiềm năng nghiêm trọng đối với công nghệ và con người, đây là các chủ đề cần được khám phá thêm trong tương lai. Bốn vấn đề chính được xác định dựa trên kết quả của nghiên cứu này.

Sự tiến hóa tiếp theo của các công việc: Sự tiến hóa tiếp theo của các công việc có thể sẽ bị ảnh hưởng bởi ChatGPT và các công nghệ trí tuệ nhân tạo (AI) đổi mới khác. Tiến hóa này có tiềm năng mang lại lợi ích cho con người, nhưng cũng đặt ra những rủi ro, chẳng hạn như thất nghiệp cho các chuyên gia trắng áo và các chuyên gia sáng tạo. Hơn nữa, tương lai có vẻ đang tiến gần hơn so với dự kiến. Ngay cả các nghề “an toàn” như lập trình viên, nhà huấn luyện và nhà phân tích AI cũng có thể đối mặt với nguy cơ bị thay thế bởi ChatGPT. Khi thế giới phát triển nhanh chóng và các công nghệ mới nổi lên, điều cần thiết là các nhà lãnh đạo trong cả khu vực công và tư nghiệp cần suy nghĩ về tương lai của thị trường việc làm và các biến đổi tiềm năng của nó do các tiến bộ như ChatGPT mang lại. Câu trả lời cho những câu hỏi này sẽ ảnh hưởng đáng kể đến các đặc điểm và xu hướng của thị trường lao động. Tương đương quan trọng là sự cân nhắc của ngành giáo dục về cách tốt nhất để chuẩn bị cho thế hệ tiếp theo trong cảnh địa hình thay đổi nhanh chóng này. Điều này yêu cầu sự biến đổi của các phương pháp giảng dạy và sự suy ngẫm sâu sắc về các kỹ năng và kiến thức cần thiết cho thành công trong kỷ nguyên mới này.

Cảnh quan công nghệ mới: Năm 2022, hai khung công nghệ nổi tiếng nhất là Web3 và Metaverse đã gặp phải những trở ngại lớn; tiền điện tử Luna và sự cố FTX ảnh hưởng đến quỹ đạo blockchain của Web3, và sự suy giảm của Meta (Facebook) ảnh hưởng đến tương lai của Metaverse. ChatGPT đã xuất hiện trên cảnh công nghệ và nhận được đón nhận tích cực từ cộng đồng Twitter trong tuần đầu tiên của nó. Vẫn còn chưa rõ ChatGPT và các công nghệ liên quan của nó có thể thách thức được các cầu thủ hàng đầu như Google, người vừa công bố một công nghệ cạnh tranh gọi là “Bard”. Tuy nhiên, như được tìm thấy trong nghiên cứu này, các trường hợp sử dụng của ChatGPT có thể cạnh tranh trong nhiều lĩnh vực, bao gồm tìm kiếm (Google), trợ lý cá nhân (Alexa và Siri), giải trí cá nhân hóa và phần mềm dưới dạng dịch vụ (SaaS). Thời đại kỹ thuật số đã mang lại một sự tiến hóa nhanh chóng trong công nghệ, và sự giới thiệu của ChatGPT có tiềm năng tác động lớn đến cảnh quan công nghệ và kỹ thuật số trong tương lai. Trong khi vẫn chưa rõ công nghệ trí tuệ nhân tạo như ChatGPT sẽ được tích hợp sâu vào cuộc sống của chúng ta đến mức nào, những người có thể tiên đoán xu hướng và thích nghi một cách chủ động sẽ được hưởng lợi đáng kể.

Nỗ lực tìm kiếm trí tuệ nhân tạo tổng quát: ChatGPT đã chắc chắn khơi dậy thêm các cuộc thảo luận về AGI, hoặc những gì mà Goertzel gọi là “AGI cùng cấp với con người”. Mặc dù có khả năng viết sáng tạo và mô hình tiên tiến, ChatGPT, được tạo ra từ một mô hình ngôn ngữ lớn (LLM), vẫn chưa đạt được mức độ của AGI. Nó vẫn chưa đạt được nhiều thành phần cơ bản của AGI, chẳng hạn như quá trình tự/nhân đạo, cảm xúc, động lực, quá trình siêu nhận thức và hệ thống xử lý suy nghĩ. Tuy nhiên, nó đã không thể phủ nhận được một bước tiến khác hướng tới AGI. Trong tương lai, ChatGPT và các công nghệ tương tự sẽ đối mặt với nhiều thách thức và cơ hội để phát triển khi họ cố gắng tiến đến AGI. Điều này bao gồm cải thiện chất lượng câu trả lời của họ, tích hợp các tiến bộ kỹ thuật mới vào các mô hình và phát triển các tính năng mới có thể mở rộng và sâu rộng hơn trong các trường hợp sử dụng rộng hơn.

Bài toán đạo đức – tiến bộ: Thảo luận về đạo đức và trí tuệ nhân tạo đã diễn ra trong thời gian dài, với nhiều ý tưởng toàn cầu đồng thuận như sự minh bạch, công bằng và chính trực. Tuy nhiên, sự khác biệt trong việc hiểu các nguyên tắc này vẫn rất lớn. Thật không may, việc phát triển và thực thi đạo đức trí tuệ nhân tạo chưa thành công và thường được coi là một khung tách biệt, không bắt buộc được áp đặt từ các tổ chức bên ngoài ngành công nghệ, mặc dù có lời kêu gọi về các khung đạo đức và các chatbot trí tuệ nhân tạo trong giáo dục và chăm sóc sức khỏe. Tuy nhiên, cần thiết phải tăng tốc các cuộc thảo luận và giải quyết sự căng thẳng giữa tiến bộ công nghệ và những quan ngại đạo đức. Tiềm năng tác động tích cực và tiêu cực của ChatGPT rộng và ngay lập tức, nhấn mạnh sự cần thiết của một cuộc kiểm tra toàn diện và hình thành các hướng dẫn đạo đức chung cho việc sử dụng nó trong tất cả các lĩnh vực. Trong nghiên cứu khoa học, tạp chí khoa học danh giá “Nature” gần đây đã công bố các nguyên tắc liên quan đến việc sử dụng trí tuệ nhân tạo mô hình ngôn ngữ lớn (LLM) trong các bài báo khoa học.

Do vẻ mới và mới lạ của công nghệ, kết quả của nghiên cứu này dường như đặt ra nhiều câu hỏi hơn là cung cấp câu trả lời. Thật vậy, ChatGPT có thể trả lời (và đã trả lời) những câu hỏi này một cách dễ dàng, nhưng như những kết quả nghiên cứu của chúng tôi cho thấy, chúng ta không thể hoàn toàn dựa vào câu trả lời của nó.

Tuyên bố sẵn có dữ liệu: Bộ dữ liệu phân tích bao gồm ID Tweet và kết quả LDA (giá trị gamma) có thể được tìm thấy tại https://github.com/viriyatae/chatgpt_twitter được truy cập vào ngày 16 tháng 2 năm 2023.