まずはこの動画を見てほしいです。
この女性の声、AIなんですよ!すごくないです! えぇ━(*´・д・)━!!!
このAIはJ-Moshiという、日本語におけるリアルタイムのフルデュプレックス音声対話システムなのですが、
今回はこれについて簡単に説明します⸜( ´ ꒳ ` )⸝
J-Moshiとは?
J-Moshi(ジェイ-モシ)は、日本語でスムーズにおしゃべりできるAIシステムです。
このAIは、人がしゃべっている途中でも話を聞きながら、同時に返事ができるのが大きな特徴。まるで友達と雑談しているときのように、相づちを打ったり、「えっと…」といった合いの手を入れたりすることができます。
どんなことができるの?
- フルデュプレックス対話
人が話すのを聞きつつ、自分も同時に返事を作るしくみ。
例えば、あなたが話している最中に「うん、うん」と相づちを入れられるので、会話が止まらず、自然なやりとりが続きます。 - 日本語の会話に特化
もともと英語版の「Moshi」というAIをベースに、日本語の会話スタイルに合わせて学習しています。日本語特有のあいづちやフィラー(「あの~」「えっと」など)を自然に使ってくれます。 - 雑談が得意
ちょっとした相談や、日常会話を楽しむためにつくられているので、親しみやすい対話がしやすいのも魅力。
技術的なポイント
「怠惰な猫は今日も頑張らない」的には、あんまり難しい話はしたくないけれど…ちょっとだけ技術の面も紹介します。
- モデルサイズは7B(70億パラメータ)
- AIの「頭のサイズ」を示す数値。軽めの部類ですが、それでも動かすにはそれなりのパワーが必要です。
- 24GB以上のVRAMがあるGPUが必要
- 高性能なグラフィックスボードが必須。一般のパソコンやMacでは動かないことが多いので注意!
- 試作段階で改善中
- 今はまだ研究中の段階。雑談は得意でも、専門的な質問や最新ニュースには弱いかもしれません。
どうやって作られているの?
- 名古屋大学の研究者たちが開発
大学のスーパーコンピュータを使って、日本語の音声データをたくさん学習させています。 - 共同研究やプロジェクト支援
株式会社アイシンと一緒に“雑談・相談対話コーパス(会話データ)”を作り、国のプロジェクトからも支援を受けているそうです。 - 合成音声データの活用(J-Moshi-ext)
人間の声だけでなく、合成した音声データでも学習することで、より幅広い会話パターンに対応できるようになっています。
どんな未来があるの?
J-Moshiは、まだ試作中のシステム。なので、
- 応答がちょっとヘンになることがある
- 雑談は得意だけど、仕事の指示や専門的な話には弱い
といった問題点もあります。
でも、研究が進めば、より賢く、いろんなシーンで役立つAIアシスタントになる可能性が大いにあります。
まとめ
「AIってちょっと難しそう…」と思う方もいるかもしれません。
ですが、今回のJ-Moshiのように、雑談を自然にこなすAIが増えてくると、もっと気軽にAIを使える未来が近づいてきますね(*´ ˘ `*)
- J-Moshiは、日本語で自然な雑談ができるAIシステム。
- フルデュプレックス(同時応答)や相づち・フィラーの表現で、人間らしい会話を再現。
- まだ開発中だが、雑談系AIの新たな可能性を感じられる研究。
これから先、AIはどんどん進化していくと言われています。
無理に頑張らない働き方を目指すうえでも、こうしたAIをうまく取り入れることで、自分だけでは難しいタスクや、ちょっとした苦手を効率化できそうですね!
まずは「興味を持って触れてみる」ことが大切。興味がわいたら、ぜひJ-Moshiの情報をチェックしてみてくださいね。
「怠惰な猫は今日も頑張らない」では、これからも無理してがんばらずに成果を出すヒントをいろいろ探していきます。一緒にゆるーく学んで、ゆるーく使っていきましょう。