chatgpt - Công ty TNHH Betaplus

Ở bài viết trước, THACHLONGTECH đã giới thiệu đến các bạn về một nền tảng chatbot mới được ra mắt là ChatGPT. ChatGPT mang lại nhiều lợi ích cho người dùng, có thể dịch thuật, có thể trò chuyện, có thể viết luận văn, có thể giải toán đố, có thể nói về lịch sử của cả thế giới, có thể viết solgan nếu các bạn có nhu cầu…. Thế nhưng đằng sau sự hào nhoáng đó là những công nhân phải tiếp xúc nội dung độc hại về bạo lực, tình dục với đồng lương rẻ mạt.

ChatGPT được ca ngợi là một trong những đột phá công nghệ lớn nhất năm qua.

Sự thật đằng sau của ChatGPT là gì?

OpenAI, nhà phát triển AI này, đang huy động vốn từ nhà đầu tư để nâng định giá công ty lên 29 tỷ USD. Tuy nhiên, phía sau là góc khuất ít người biết. Cuộc điều tra của Time cho thấy để ChatGPT có thể nhanh chóng đưa ra câu trả lời ấn tượng, OpenAI sử dụng những lao động ở Kenya với mức lương ít ỏi cho công việc kiểm duyệt nội dung
Công việc này đặc biệt quan trọng với OpenAI. Trước ChatGPT, nền tảng GPT-3 đã có thể xâu chuỗi nội dung, nhưng chưa được phát hành rộng rãi vì nó có xu hướng đưa ra những nhận xét bạo lực, phân biệt giới tính, chủng tộc. Đây cũng là vấn đề chung của các mô hình AI, do dữ liệu đầu vào thường được thu thập từ Internet, vốn chứa hàng loạt thông tin độc hại, sai lệch. Ước tính với lượng dữ liệu OpenAI thu thập để huấn luyện trí tuệ nhân tạo, công ty phải cần hàng trăm người làm trong hàng thập kỷ mới có thể rà soát toàn bộ dữ liệu thủ công.

Dùng AI để kiểm soát AI

Cách hiệu quả để hạn chế thiên kiến và sai lầm của AI là tạo một cơ chế an toàn bằng AI, tương tự cách những nền tảng lớn như Facebook đã thực hiện. OpenAI đã học tập và xây dựng AI có thể phát hiện ngôn ngữ thù địch để loại bỏ chúng khỏi nền tảng trước khi đem đến cho người dùng những đầu ra “sạch đẹp”.

Bài toán khá đơn giản: công ty cung cấp cho AI dữ liệu đầu vào là những ngôn từ mang tính bạo lực, kích động, thù địch, lạm dụng tình dục. Sau khi “tiêu thụ” lượng dữ liệu độc hại này, AI sẽ tự động phát hiện từ khóa, nội dung tương tự. Nền tảng sau đó tích hợp vào ChatGPT để kiểm soát, lọc dữ liệu được cho là không tốt trước khi đến tay người dùng. Nó cũng giúp xóa đi những văn bản độc hại khỏi bộ dữ liệu có sẵn của OpenAI, trước khi đào tạo các mô hình AI trong tương lai.

chat gpt là gì

Câu hỏi đặt ra là làm sao để có được kho dữ liệu độc hại đủ lớn để huấn luyện AI?

Bên kia bờ Ấn Độ Dương, dưới nắng gắt của châu Phi, một công ty gia công phần mềm ở Kenya có đáp án cho câu hỏi này. Công ty Sama, đối tác của OpenAI, là cái tên quen thuộc của các công ty lớn ở Thung lũng Silicon như Google, Meta và Microsoft. Họ khẳng định mình là công ty “AI có đạo đức”, đã giúp hơn 50.000 người thoát nghèo. Công việc của họ là tìm kiếm nội dung độc hại từ nơi tăm tối nhất của Internet, như những lời mô tả lạm dụng tình dục trẻ em, thú tính, giết người, tự tử, tra tấn, tự làm hại bản thân… để làm phong phú dữ liệu đầu vào cho các đối tác huấn luyện AI.

Sama thay mặt OpenAI trả lương cho những người làm công tác dán nhãn dữ liệu với chi phí từ 1,32 đến 2 USD (31-47 nghìn đồng) mỗi giờ, tùy thâm niên và hiệu suất.

Góc khuất về ChatGPT ít người biết

“Trái với vai trò quan trọng họ đang nắm giữ, cuộc sống của các công nhân này luôn bấp bênh, điều kiện làm việc khắc nghiệt”, Partnership on AI – Liên minh các tổ chức AI – cho biết.

Người phát ngôn của OpenAI xác nhận công nhân của Sama ở Kenya đóng góp vào công cụ họ đang xây dựng để phát hiện nội dung độc hại, đã được tích hợp vào ChatGPT. “Sứ mệnh của chúng tôi là đảm bảo trí tuệ nhân tạo mang lại lợi ích cho toàn nhân loại và chúng tôi nỗ lực xây dựng hệ thống AI an toàn và hữu ích nhằm hạn chế nội dung thiên vị và có hại. Phân loại, lọc nội dung có hại là bước cần thiết để giảm thiểu bạo lực và tình dục có trong dữ liệu đào tạo”, Time dẫn lời phát ngôn viên của OpenAI.

AI được kỳ vọng là tia sáng dẫn dắt ngành công nghệ bước qua thời kỳ ảm đạm. Nhưng điều kiện làm việc của những người dán nhãn dữ liệu cho thấy một phần đen tối trong bức tranh đó. AI đang dựa vào sức lao động của những người có thể đang bị bóc lột, tổn thương với mức lương bèo bọt để đóng góp cho ngành công nghiệp trị giá hàng tỷ USD.

Một nhân viên Sama được giao nhiệm vụ đọc và dán nhãn văn bản cho OpenAI nói với Time rằng anh thường xuyên bị ảo giác sau khi đọc mô tả bằng hình ảnh về một người đàn ông quan hệ tình dục với một con chó trước mặt một đứa trẻ. “Đó là sự tra tấn. Bạn sẽ đọc những nội dung như vậy suốt cả tuần. Cuối tuần, tâm trí bạn như điên đảo khi nhớ lại việc đó. Đây là môi trường làm việc độc hại với chúng tôi”, người này nói.

Hợp đồng giữa Sama và OpenAI

OpenAI ký ba hợp đồng tổng trị giá 200.000 USD với Sama cuối năm 2021 để gắn nhãn các mô tả bằng văn bản về lạm dụng tình dục, ngôn từ kích động thù địch và bạo lực. Khoảng ba chục công nhân được chia thành ba đội, mỗi đội tập trung vào từng nhóm nội dung khác nhau. Ba nhân viên kể họ phải đọc và dán nhãn 150-250 đoạn văn bản mỗi ca làm việc kéo dài 9 tiếng. Những đoạn trích đó dài 100-1.000 từ.

Một nhân viên Sama phải đọc câu chuyện về vụ hãm hiếp từ một website khiêu dâm. Sau đó cô phải trải qua bài kiểm tra từ OpenAI xem đây có phải nội dung bạo lực tình dục không. Những bài kiểm tra như vậy là một phần trong công việc của các lao động Sama trước khi được quyền “nuôi dạy AI”.

Tất cả nhân viên được phỏng vấn nói họ bị tổn thương tinh thần trầm trọng, dù đã được tham dự một số buổi tư vấn sức khỏe. Người phát ngôn của Sama cho biết các nhà trị liệu sức khỏe được mời đến là những người được đào tạo chuyên nghiệp, có giấy phép hoạt động.

Trong hợp đồng nêu rõ, OpenAI trả 12,5 USD một giờ cho đối tác, tuy nhiên người lao động chỉ nhận được khoảng 1/6 số tiền này. Trung bình mỗi tháng họ kiếm được 170 USD và khoảng 70 USD tiền thưởng nếu đáp ứng các chỉ số về hiệu suất. Nếu làm tăng ca, mỗi người có thể nhận từ 1,32 đến 1,44 USD sau thuế, mức thấp hơn lương tối thiểu của lễ tân ở Kenya.

Người phát ngôn của OpenAI khẳng định công ty không đưa ra bất kỳ mục tiêu năng suất nào và Sama chịu trách nhiệm quản lý điều khoản thanh toán và sức khỏe tâm thần cho nhân viên. “Chúng tôi coi trọng sức khỏe tinh thần của nhân viên và của nhà thầu. Người lao động có thể từ chối công việc mà không bị phạt. Việc tiếp xúc với nội dung tục tĩu sẽ có giới hạn và thông tin nhạy cảm sẽ được xử lý bởi người lao động đã được đào tạo chuyên sâu”, đại diện OpenAI nói.

Tuy nhiên, mối quan hệ giữa OpenAI và Sama bắt đầu rạn nứt từ tháng 2/2022. Sama dừng mọi công việc của mình cho OpenAI, sớm tám tháng so với thỏa thuận trong hợp đồng. Công ty gia công phần mềm nói việc thu thập hình ảnh cho OpenAI không được hướng dẫn cụ thể về những gì pháp luật cấm. Sau đó, OpenAI gửi “hướng dẫn bổ sung” nhưng Sama vẫn đưa ra thông báo hủy toàn bộ sự án.

Sau quyết định của Sama, nhóm công nhân bị chuyển đến một sự án trả lương thấp hơn, chuyên phân loại nội dung khiêu dâm với 70 USD mỗi tháng. Do hợp đồng bị hủy, cả OpenAI và Sama đều cho biết khoản tiền 200.000 USD không được thanh toán đầy đủ.

Giới chuyên gia cho biết nhu cầu lao động dán nhãn dữ liệu cho các hệ thống AI sẽ không biến mất khi ngành công nghiệp này ngày càng phát triển. “Chúng rất ấn tượng, nhưng ChatGPT và các mô hình AI không phải là ma thuật, chúng dựa vào chuỗi cung ứng khổng lồ về lao động của con người và nguồn dữ liệu thu thập được”, Andrew Strait, một nhà đạo đức học về AI, nói.

Nguồn: Internet #VnExpress

Một nền tản chatbot mới được sinh ra và đang được cộng đồng mạng quan tâm rất lớn đó là ChatGPT. Khi chúng ta trao đổi thông tin với nó thì giống như chúng ta đang trao đổi với 1 người vậy.

Thế nhưng ChatGPT là gì? và ChatGPT có thể làm được gì thì cũng ít người biết được. Các bạn cùng THACHLONGTECH tìm hiểu về CHATGPT.

1. ChatGPT là gì?

ChatGPT là hệ thống chatbot được tạo bằng khoa học công nghệ GPT-3 viết tắt của Generative Pre-training Transformer, là một chatbot do OpenAI phát triển và ra mắt vào tháng 11 năm 2022. ChatGPT được xây dựng dựa trên GPT-3.5. Đây là một mô hình sử dụng công nghệ AI để xử lý tiếng nói hiện đại nhất hiện nay. Nó có khả năng tạo văn bản giống với con người chỉ với những từ khóa cơ bản. ChatGPT có thể giải đáp thắc mắc của các bạn một cách nhanh chóng, tìm kiếm mọi thông tin bạn cần một cách chính xác và nhanh chóng.

Điểm mạnh thực sự của con chatGPT chính là trả lời các câu hỏi trên các lĩnh vực với chất lượng đáng kinh ngạc.

2. ChatGPT được xây dựng như thế nào?

GPT – 3.5 được biết đến là mô hình ChatGPT mới nhất hiện nay. Nó được tạo nên từ kho dữ liệu khổng lồ với mã và thông tin đến từ internet. Trong đó phải kể đến website Reddit – nơi lưu trữ các thông tin trên thế giới cũng như các cuộc tranh luận đang diễn ra hàng ngày về rất nhiều chủ đề khác nhau. Điều này giúp nó mô phỏng được các đoạn đối thoại và cách giao tiếp của con người.

Bên cạnh đó, ChatGPT cũng được đào tạo bằng cách sử dụng phản hồi của con người. Nhờ vậy AI xác định được mong muốn của mỗi các nhân khi đặt câu hỏi.

3. ChatGPT có thể làm được gì?

Nếu bạn đã tìm hiểu thì chắc hẵn bạn đã thấy được nó có thể thực hiện trả lời các câu hỏi chả khác gì một chuyên gia.
Khi chat GPT ra đời nó có thể thực hiện những tác vụ mà trước kia một người bình thường cần phải mất rất nhiều thời gian để tìm giải pháp.
Đằng sau chatGPT là một hệ thống máy học và kho dữ liệu lớn để khi có một câu hỏi được nhập vào hệ thống sẽ phân tích và đưa ra câu trả lời chất lượng với lối hành văn như là ngôn ngữ tự nhiên của con người.
Khi tôi biết được thông tin về Chat GPT từ các youtuber ở nước ngoài tôi thực sự ngạc nhiên trước sức mạnh của nó.
Những tác vụ trước kia có thể mất nhiều thời gian để tìm kiếm Google giờ đây có thể sau vài giây thì đã có chatGPT đã đưa ra câu trả lời.

Sáng tạo nội dung với ChatGPT

Đây là một trong những tính năng mà bạn không thể bỏ qua khi dùng Chat GPT. Chat GPT cung cấp tới bạn rất nhiều câu trả lời cho một nội dung nào đó mà bạn đưa lên để tham khảo. Từ đó chúng ta có thể sử dụng để phát triển nội dung của riêng mình.
Bạn có thể dựa vào những câu trả lời mang tính chất tham khảo của Chat GPT để triển khai thêm cho nội dung của mình.

ChatGPT dịch thuật

Với đoạn dịch từ tiếng Anh sang tiếng Việt đơn giản như dưới đây thì có thể thấy Chat GPT dịch rất trơn tru.

Sáng tạo nội dung với Chat GPT

Đây là một trong những tính năng mà bạn không thể bỏ qua khi dùng Chat GPT. Chat GPT cung cấp tới bạn rất nhiều câu trả lời cho một nội dung nào đó mà bạn đưa lên để tham khảo. Từ đó chúng ta có thể sử dụng để phát triển nội dung của riêng mình.

Bạn có thể dựa vào những câu trả lời mang tính chất tham khảo của Chat GPT để triển khai thêm cho nội dung của mình.

ChatGPT có rất nhiều ưu điểm và tính năng hay giúp người dùng tiếp nhận thông tin một cách nhanh chóng và chính xác. Thế nhưng đằng sau ánh hào quang đó là những góc khuất mà nhiều người phải tiếp nhận như nội dung độc hại về bạo lực, tình dục…. Các bạn đón chờ bài viết sau về góc khuất của nền tản ChatGpt đang hot hiện nay nhé