トップページへ戻る

ニュース

HOME > ニュース > Gadgetニュース

公開日 2023/06/09 16:35
あくまで特定分野の学術論文のみ

ChatGPTのフェイク論文を99%見破るアルゴリズム、米カンザス大学が発表

多根清史
今や巷には人間がAIチャットボットに書かせた論文やレポートが溢れかえっている一方で、それを見分ける技術が追いついていない。

何十もの企業が検出技術の開発を競っているものの、ChatGPTを開発したOpenAIが作ったものでさえ上手く機能しておらず、どれもが有効とは言えない。直近では、ChatGPT自らにChatGPTが書いたのか判定させた教員が大問題になった出来事もあった。

そんななか米カンザス大学の研究者らが、ChatGPTによる学術的なテキストを99%以上の精度で検出できるアルゴリズムを開発したとの論文を発表した。

この論文は、査読を経て『Cell Reports Physical Science』に掲載されたもの。まず生物学から物理学まで、人間の著者による科学研究論文データをChatGPTに与え、そこから128本のAI論文、合計1,276段落分のデータセットを生成させた。

これらAIによる段落をもとにして、ChatGPT検出アルゴリズムを構築。そして人間が書いた30本の記事とChatGPTによる60本の記事、合計1,210段落に相当するデータセットを作成し、アルゴリズムをテストしたという。

その結果、99%の確率でChatGPTによる記事を検出できたとのこと。そして段落レベルでは、92%の確率で判別したと主張されている。

本論文によると、ChatGPTによる文章にはいくつかのクセがあるそうだ。例えば人間の執筆者であればより長い段落を書き、より多くのボキャブラリや句読点を使い「しかし」「だが」などの接続詞を使う傾向があるとのこと。またChatGPTは、図や他の研究者の説を引用することが苦手らしい。

このアルゴリズムは、あくまで学術的な文章、特に科学雑誌に掲載される学術論文向けに構築されており、高校生のレポート等にはそのままでは使えない。しかし、理論的には同じ手法で他のタイプの文章を検出するモデルも構築できるという。

また、本研究は「概念実証」にすぎず、より大規模なデータセットを用いて、より堅牢で、おそらくより正確なアルゴリズムが開発できるとも述べられている。まだまだ伸びしろがあり、学術論文を超えた汎用性を実現できるポテンシャルはある、と示唆されているようだ。

しかし、ChatGPTを初めとしたAIチャットボットはまだ発展途上であり、検出アルゴリズムの進歩が追いつく前に人間が書く文章により近づき、判別が難しくなる可能性もあるだろう。そうしたイタチごっこがAI関連企業へのさらなる投資を促し、ますますAIの進化を加速させるのかもしれない。

Source: Cell Reports Physical Science
via: Gizmodo

新着クローズアップ

クローズアップ

アクセスランキング RANKING
1 女子プロゴルフ「ニチレイレディス」6/19から3日間の放送・配予定
2 NTTソノリティ、耳を塞がない集音器「cocoe Ear」一般発売開始。テレビ向け送信機も同時発売
3 音楽の熱量や快感までも引き出す。コスパ抜群、FOCALのアクティブスピーカーの可能性は無限大!
4 テレビの映りが悪い!真っ先に確認したい3つのポイント
5 7畳に4K/100型&5.1.4chを実現!Dolby Atmos対応の本格シアター
6 濃厚なアナログ・テイスト、aurender15周年記念の旗艦ネットワークプレーヤー「A1」の音楽性
7 <HIGH END>WiM、初のサウンドバー「WiM Bar」発表。ドルビーアトモス対応、リアスピーカーも追加可能
8 ヤマハの振動板技術が北日本音響のスピーカーユニットに採用。9cmフルレンジユニット「MS-TAMANEGI」
9 ゼンハイザー初のイヤーカフ型イヤホン「ACCENTUM Clip」。LDACにも同社初対応
10 Google、Gemini搭載の新スマートスピーカー「Google Home スピーカー」
6/19 10:49 更新

WEB