アルファベットのABC

話し言葉と書き言葉ってずいぶん違う

ちょっと興味深かったので、メモ。Yahoo!ニュースの「個人」に出ていたIT・科学の記事です。

ロボットの会話に未来はあるか?発売秒読みのシャープ社製”ロボホン”から考える会話AIエンジン開発

斎藤由多加 | ゲームクリエーター,アップル研究家
2016年5月13日 9時41分配信

発表会ではスムーズに受け答えをするロボットも、一般の人を相手にするとうまくやり取りできない理由が解説された記事です。

これって、なぜか英語のできる人ほど「ドラマや映画に出てくる英語はわからない」なんてことを言う人がいますけど、なんか似てません?

(参考)聞き流すだけで本当に英語が話せるようになるの? 「超」英語法の場合

英語ができない人間から見ると、「同じ英語なのに、何言ってるんだろう」なんて思ってしまいますが(笑)

ロボットの会話AIエンジンで紹介されている考え方が、その答えを教えてくれそうです。

口語と文語は異なる言語体系

会話のイメージ

記事では、エンジニアが作る「つまらない会話」の原因として、「シナリオにまとめた受け答えをパターンで登録している」ことが挙げられています。

細やかな対応をするには、それだけシナリオの数や組み合わせが複雑になっていくわけですが、これでは「会話をする」という問題解決にならないというんですね。

というのも、会話で使う「口語」は、文章を書く際の「文語」とは違う仕組みでできあがっていて、会話AIに必要なのは、「省略を補完する技術」だというのです。

記事でも、口語を文字起こしするとよくわかると解説されているのですが、この点は確かにそうです。

聞こえたままを文字に起こしたものは、文章として理解しにくいものになってしまいます。普通に文字起こしする場合でも、「ケバ」は取って起こすのが普通じゃないかな。

ケバというのは、「えー」とか、「あー」といった文章に関係ない音とか、相槌、特に意味のない口癖もこれに入ります。

ケバを取らないで起こそうとすると、かえって割増料金になる場合もあるんですよ(笑)

ケバを取って起こしたものでも、どうしても文章としては意味不明な所が出てくるものなので、さらに読みやすくする場合は文章を整える必要が出てきます。

専門用語では「整文」(せいぶん)と言います。

つまり、口語を読みやすい文章にするには、それなりの変換作業が必要になるんですね。

このように、文章にするとへんてこなのに、耳で聞くとあまり違和感がないのは、「言葉がメロディに乗っているから」。

記事では、さらに以下の点が挙げられています。

・省略を大前提とした構造になっている
・会話には、やりとりがある
・会話の補完のプロセスそのものが「相手との共感表現」そのもの

口語で必要とされるものは、文語では必要ないものとして削除されてしまうか、情報が足りないために意味が通じなくなってしまう──

こうしたことは、義務教育のペーパーテスト環境で育ってきた感覚では気付くことが難しいと指摘されています。

なぜなら、「学校で習う知識は、ほぼすべてが文語だから」というのが著者の意見なのですが、確かにそうなのかもしれません。

そして、英語ができる人なのに、「ドラマや映画に出てくる英語がわからない」というのも、こうした口語と文語の仕組みの違いが影響しているのかもしれませんね。

こうした発想はロボットの分野でも生かしきれていないみたいですけど、さらに研究が進んで情報が蓄積されてきたら、私たちが言葉を習得する際にも大きな助けになってくれるのかもしれませんよ。

ちょっと興味深かい話です。