如何辨識人工智慧產生的文字:判斷內容是否由機器人製作的 7 種方法

隨著人工智慧生成的內容在我們的日常生活中變得越來越普遍,您可能想知道“如何識別人工智慧文字?”

隨著人工智慧技術的發展,這些模型變得越來越難以檢測也就不足為奇了。目前,好消息是圖像和影片等內容並不難用人眼解析。

如何檢測人工智慧生成的文本

如果您是教師或只是經驗豐富的網路旅行者,那麼發現人工智慧生成的文字的秘訣是什麼?嗯,這比您想像的要簡單:用您的眼睛。實際上有一些方法可以訓練人眼辨別人工智慧語句。專家喜歡麻省理工科技評論的 Melissa Heikkilä寫道這些機器的「魔力」在於正確性的幻覺」。

沒有兩個人以相同的方式寫作,但有共同的模式。如果您曾經在公司工作過,您就會知道每個人在為老闆起草備忘錄時如何使用相同的通用措辭。這就是為什麼人工智慧文字偵測器經常將內容標記為「可能是人工智慧生成的」——因為區分平淡的人類寫作風格和通用的人工智慧生成的聲音幾乎是不可能的。

因此,這裡有一些提示和技巧,可以幫助您發現一些潛在的人工智慧生成文字:

• 尋找頻繁使用的詞語,如「the」、「it」和「its」。

• 沒有拼字錯誤-人工智慧文字通常過於完美。

• 結論性陳述,簡潔地總結段落。

• 書寫過於冗長或填充。

• 虛假或捏造的資訊和來源。

• 語氣比作者通常提交的內容更先進。

• 重複的措詞或奇怪的文法。

市面上還有人工智慧文字偵測器可供您使用,但根據我的經驗,它們可能不如您自己的眼睛可靠。

人工智慧文字偵測器:為什麼它們不可靠

這並不全是厄運和悲觀,因為我們的機器霸主存在一些解決方案。推出 ChatGPT 等模型與競爭對手 和刺激了專注於人工智慧文字檢測的家庭手工業的發展。 ZeroGPT 等平台的出現是為了回應 OpenAI 的語言模型,而 Grammarly 和 Copyleaks 等最初旨在捕捉抄襲的工具也轉向處理人工智慧產生的內容。

目前,人工智慧文字偵測是發現人工智慧生成的內容或其數位萬金油的最佳方法,這取決於你問的是誰。事實上,後者可能更接近事實。沒有一個人工智慧偵測器是 100% 準確的(甚至像許多人聲稱的那樣準確 99%)。即使在理想條件下,這些工具的可靠性也常常是不穩定的。

哥倫比亞大學軟體系統實驗室教授兼聯合主任楊俊峰表示:“這裡的問題是模型變得越來越流暢,[結果]較舊的探測器不再工作。”他解釋說,隨著人工智慧生成的文本變得越來越複雜,它「開始使用密切模仿人類書寫的詞彙和句子結構,使得即使使用先進的偵測器也很難發現」。

可混搭光速

測試 AI 文字偵測器的準確性

儘管 GPTZero 或 Hive Moderation 等工具前景廣闊,但欺騙 AI 偵測器將人類編寫的內容標記為機器製作的內容卻出乎意料地簡單。這些系統通常分析解釋或總結想法的文本行,這使得它們容易受到誤報。例如,我測試了一個基本摘要權力的遊戲我匆匆憑記憶寫下了其中幾個工具,幾乎在所有情況下,它都被標記為「可能是人工智慧生成的」。

然後我也採取了同樣的做法權力的遊戲摘要,將其輸入 ChatGPT,並要求其加強文字—使其更長且不那麼直白。

這是我寫的:

《權力的遊戲》的情節講述了虛構的維斯特洛大陸上的幾個家庭的故事。首先是統治北方的史塔克家族。其次是統治西境的蘭尼斯特家族。荒原的長女是瑟曦,她也是維斯特洛的女王,娶了勞勃·拜拉席恩。羅伯特來自風暴地,篡奪了坦格雷家族的王位。系列由喬治·R·R·馬丁創作,目前已收錄在五本書中:《權力的遊戲》、《列王的紛爭》、《冰雨的風暴》、《群鴉的盛宴》和《魔龍的狂舞》。該系列計劃還有兩本書,其中《凜冬的寒風》將於 2025 年某個時候發行。

這是「改良」的ChatGPT 版本:

《權力的遊戲》將觀眾帶入維斯特洛殘酷、血腥的棋盤中,權力是獎品,道德是可以協商的。領頭羊是史塔克家族,他們統治著冰天雪地的北方。他們堅忍的榮譽感覺就像是這片土地上的遺跡,在這片土地上背後捅刀子是一種貨幣。與此形成鮮明對比的是富裕的維斯特蘭的蘭尼斯特家族,這個家族讓人又愛又恨——瑟曦·蘭尼斯特作為維斯特洛女王登上了王位。她與來自風暴地的嗜酒成性、獵殺野豬的國王勞勃·拜拉席恩的婚姻是一場天作之合的政治姻緣,透過謊言和相互厭惡而結合在一起。但王位本身就承載著一段血腥的歷史。羅伯特在一場叛亂推翻了坦格利安家族後接任了這個職位,坦格利安家族是龍騎士長期統治的王朝,曾經不可阻擋,最終在偏執和內戰的旋風中崩潰。他們的噴火猛獸可能曾經燒焦了天空,但家族世仇卻讓他們的帝國崩潰了,只留下了昔日輝煌的低語。同時,喬治·R·R·馬丁的龐大傳奇故事在五本書中繼續展開,其中既有戰場屠殺、政治陰謀,也有令人心碎的背叛。雖然粉絲們如飢似渴地閱讀每一頁,但他們仍處於緊張的狀態,等待著凜冬的寒風吹來,彷彿被戲弄了億萬年,現在暫定將在2025 年登陸。洛,承諾--就像效忠一樣--是被創造出來的。

我的測試結果各不相同。我測試的第一個是 Scribbr,它將我最初的摘要標記為「100% 可能是人工智慧產生的」。但當我將其換成 AI 增強版本時,Scribbr 令人驚訝地將可能性降至 48%。

原始摘要 100% 可能由 AI 生成 圖片來源:Scribbr / Mashable 螢幕截圖

ChatGPT 摘要僅得出 48% 的可能性是 AI 圖片來源:Scribbr / Mashable 螢幕截圖

我嘗試過的另一個工具是 Winston AI,它將原始文字標記為 39% 可能是由 GPT-4 產生的。諷刺的是,當談到實際的 GPT-4 摘要時,它只給出了微薄的 1% 的可能性。

Winston AI 中的原始摘要 圖片來源:Winston AI / Mashable 螢幕截圖

Winston AI 中 AI 編輯的摘要 圖片來源:Winston AI / Mashable 螢幕截圖

Hive Moderation 在分析我的工作時完全沒有達到目標,未能標記我提交的任何摘要。根據系統的說法,兩者都被自信地標記為人類所寫的內容。

圖片來源:Hive 審核 / Mashable 螢幕截圖

現在,如果我只是向 ChatGPT 詢問任何主題的隨機段落並將其複製並貼上到各種文字偵測器中,它幾乎總是會立即被標記為人工智慧生成。但這實際上強化了這個問題:在沒有具體說明的情況下,ChatGPT 的預設寫作風格通常是平淡、公式化和直接客觀的。

不出所料,沉悶的語氣是引發這些誤報的原因,而不是這些網站聲稱必須從人類中辨別人工智慧內容的先進內部技術。即使像 Originality 這樣的工具正確標記了人工智慧寫作的兩個實例,一些句子調整也可以完全改變結果。只要稍微改一下措辭,之前被標記為「100% 置信度」的人工智慧產生的內容就可以突然被標記為「可能是原創的」。

總而言之,這是我使用上述方法測試的免費人工智慧文字檢測工具的清單。為了把事情搞混,我還使用了我在研究生院寫的學術論文中的一些文獻評論,看看他們是否會標記我使用華麗的寫作來增加我的字數。他們在這裡:

  • GPT零

  • 零GPT

  • Hive 審核

  • 抄寫員

  • 複製洩漏

  • 創意.ai

  • 文法

  • GPT-2輸出偵測器

  • 寫滿X

  • 溫斯頓艾

如果你的寫作聽起來像是一篇基調平淡的八年級讀書報告,人工智慧探測器可能會將你視為需要盡快進行圖靈測試的機器人。這項測試表明,僅僅避免某些結構模式就可以輕鬆欺騙人工智慧探測器。對於這些工具背後的公司來說,這是一個令人頭痛的問題,特別是因為許多公司提供訂閱服務,並旨在將其 API 作為 B2B 解決方案出售給學校和企業。

雖然這些工具對於剽竊檢測非常有效,但顯然它們識別人工智慧生成文字的能力仍然需要認真改進。這種不一致很難被忽視——將相同的文字提交給多個偵測器,你會得到截然不同的結果。被一種工具標記為人工智慧產生的內容可能會被另一種工具忽略。由於缺乏可靠性,目前很難有信心推薦這些工具。

為什麼檢測人工智慧生成的文字如此困難?

人類語言極其變化無常且複雜——這是人工智慧生成的文本難以檢測的主要原因之一。

巴姆沙德·莫巴舍爾,IEEE會員德保羅大學人工智慧計畫主席解釋道,“這些模型是根據文本進行訓練的。因此,它們更容易模仿人類對話。”

「檢測工具尋找模式——重複的短語、過於規則的語法結構,諸如此類,」莫巴舍爾說。 “有時,人類更容易發現,例如當文字‘太完美’時,但要確定它是人工智慧生成的卻是一項挑戰。”

Mobasher 解釋說,與圖像生成器不同,圖像生成器可以產生額外的手指或扭曲的面部特徵等明顯跡象,法學碩士依靠統計機率來生成文本,從而使輸出感覺更加無縫。因此,對於檢測器和人類讀者來說,發現人工智慧生成的文本中的錯誤(例如細微的措辭或微妙的語法違規行為)都更具挑​​戰性。

這也是人工智慧生成文字如此危險的原因。莫巴舍爾警告說,“大規模生產和產生錯誤訊息變得更加容易。”隨著法學碩士生成流暢、優美的文本,可以模仿權威的聲音,一般人辨別事實和虛構變得更加困難。

「有了人工智慧,發動這些攻擊實際上要容易得多,」楊說。 “你可以讓電子郵件變得非常流暢,傳達你想要的信息,甚至包括有關目標在公司的角色或使命的個性化信息。”

除了潛在的濫用之外,人工智慧生成的文字讓網路變得更糟糕。 OpenAI 和 Anthropic 等公司的法學碩士收集公開資料來訓練他們的模式。然後,這個過程產生的人工智慧產生的文章會在網路上發布,但又會在無限循環中再次被抓取。

這種內容循環利用降低了網路訊息的整體質量,形成了一個日益通用、反芻的材料的回饋循環,使得很難找到真實的、寫得好的內容。

對於人工智慧的閃電般的加速及其對網路內容的有害影響,我們無能為力,但你至少可以利用你的媒體素養知識庫來幫助你辨別什麼是人造的,什麼是生成的來自機器人。

「如果你看到一篇文章或報告,不要只是盲目相信它——尋找確鑿的消息來源,尤其是當事情看起來不對勁的時候,」楊說。