和歌山信愛女子短期大学 保育科 講師(専任) 渡辺直人

はじめに ――――――――――
 和歌山信愛女子短期大学の保育科教員である渡辺直人が、ChatGPTに関する学術的論考を発表しました。これは、日本では4報目となるChatGPTにおける実証的研究となります。論文は日本のプレプリントサーバーである「Jxiv」にて、2023年5月26日  に一般公開されています。なお、準備が整い次第、英訳後に海外のOASPAにも投稿される予定になっています。

論文の概要 ――――――――――
 昨今では、ChatGPTが飛ぶ鳥を落とす勢いで普及し、高い評価を得ております。しかしながら、ChatGPTに関する学術的検討はほとんどないままに広がっており、昨今では多くの問題が浮き彫りとなってきております。早急な基礎研究が求められる昨今、本研究ではChatGPT(ver.3.5)の評価能力(文章評価)を検証しました。

 研究の手続きですが、まず報道レポート・記事を100本無作為に抽出しました。それらをChatGPTに100点満点で、1本につき3度評価させました。3度評価させたのち、点数を降順で「High」「Middle」「Low」の3群に分けました。分析では、その3群を対象にFriedman検定及びHolm法多重比較を行いました。

 ここで、1点仮説が浮かび上がります。ChatGPTが高い信頼性を得ているというのであれば、評価得点は3度とも相違ない点数が返されるはずです。
(帰無仮説:3群間に差はある。)

 しかしながら、本研究の結果、Friedman検定、そしてHolm法多重比較で、3群間全てのペアで有意な差があることが認められました(p<.01)。すなわち、帰無仮説は棄却されず、採択されることとなりました。

 結論、この結果から、ChatGPT(ver.3.5)の評価はばらつきがあり、安定していないことが示されました。教育の評価にも応用することは難しいことが示されました。

結び ――――――――――
 本研究・ChatGPTに興味を持たれた方におかれましては、ぜひお問い合わせ、または取材に来ていただければ幸いです。
(お問い合わせ先は以下を参照)

―――本研究に関して お問い合わせと情報―――
『教育評価とChatGPT: 統計アプローチによる実証的研究』
DOI: https://doi.org/10.51094/jxiv.376
URL:https://jxiv.jst.go.jp/index.php/jxiv/preprint/view/376
〒640-0341 和歌山県和歌山市相坂702-2
和歌山信愛女子短期大学
保育科 講師(専任) 渡辺 直人
EMail:
TEL: