Vỏ quýt dày có móng tay nhọn: DetectGPT
Phương Tôn
19 tháng 2, 2023
https://saigonnhonews.com/doi-song/cong-nghe/vo-quyt-day-co-mong-tay-nhon-detectgpt/
Với nhiều người, ChatGPT của OpenAI có thể
giúp nhiều việc. Từ nay, người người nhà nhà đều có thể trở thành “nhà văn”,
“nhà thơ”, “nhà báo”, “nhà khoa học”…
Cũng vì lý do đó nên một câu hỏi liền được đặt
ra: Liệu một văn bản là do con người hay chatbot AI (Artificial Intelligence)
viết? Đã có những người chỉ trích, phàn nàn rằng phần mềm này sẽ bị lạm dụng để
gian lận trong các bài thi ở trường học hoặc đại học. Theo một nghiên cứu, AI
thậm chí có thể đánh lừa các chuyên gia khoa học. Vì lý do này, nhiều trường đại
học danh tiếng trên thế giới như Paris Science Po thậm chí cấm sử dụng ChatGPT.
Trong tương lai, muốn gian lận trong trường học hay ở đại học không còn là việc
dễ dàng. Với DetectGPT,
người ta có thể phơi bày nguồn gốc thật sự các văn bản từ AI với độ chính xác
lên tới 95%.
Các nhà nghiên cứu tại Đại học Stanford đã
phát triển một phương pháp mới để có thể nhận dạng ngay các văn bản do AI tạo
ra, chẳng hạn từ ChatGPT. DetectGPT thậm chí không cần phải được huấn luyện để
phân tích văn bản, vì điều đó sẽ yêu cầu một lượng dữ liệu khổng lồ. Các nhà
khoa học cho rằng đằng sau chức năng của ChatGPT và những thứ tương tự, có một
mô hình có thể phân biệt rõ ràng về mặt toán học với cách viết văn bản của con
người.
Ý tưởng làm nên DetectGPT được thử nghiệm dựa
trên các mô hình nguồn mở (Open-Source-Model) phổ biến, bao gồm cả những mô
hình có sẵn thông qua API của OpenAI (Application Programming Interface – “Giao
diện lập trình ứng dụng”). Đây là một tập hợp các quy tắc, giao thức và công cụ
cho phép các ứng dụng khác nhau tương tác với nhau. API cung cấp cách truyền dữ
liệu và thông tin giữa các ứng dụng khác nhau, cho phép chúng tương tác và làm
việc với nhau một cách hiệu quả.
API được sử dụng rộng rãi trong phát triển phần
mềm và ứng dụng, đặc biệt trong các ứng dụng web, để kết nối các hệ thống khác
nhau và chia sẻ dữ liệu và chức năng. Vì vậy, DetectGTP chỉ cần sử dụng LLM
(Large Language Model) để phát hiện đầu ra của chính nó. Về cơ bản, nó hỏi một
LLM rằng, nó “thích” một mẫu văn bản đến mức nào.
Vấn đề ở đây không phải là xác định mô hình
ngôn ngữ có sở thích nào, mà là nhận ra liệu văn bản có đến từ LLM tương ứng
hay không. Nếu mô hình LLM thích nó rất nhiều, rất có thể đó là từ mô hình. Nếu
LLM không thích nó, thì nó không được viết bởi mô hình này. Và theo các nhà
nhiên cứu, phương pháp này hoạt động tốt hơn nhiều so với đoán ngẫu nhiên.
Trong thử nghiệm, các nhà nghiên cứu tại Đại học
Stanford đã đánh giá mức độ các LLM khác nhau được công khai truy cập, những
văn bản do con người viết cũng như văn bản của chính họ, bao gồm những bài báo
giả mạo và bài luận học thuật. Nó cũng được đánh giá xem LLM phản ứng như thế
nào trung bình với 100 yếu tố gây nhiễu trong văn bản của LLM hoặc văn bản được
tạo bởi con người. Dựa trên phương pháp này, các nhà nghiên cứu có thể phân biệt
khá tốt nguồn các văn bản.
No comments:
Post a Comment