みなさん、おはようございます!タカハシ(@ntakahashi0505)です。
こちらの記事は、タカハシが音声メディアVoicyの「スキルアップラジオ」にて放送した内容から、ピックアップしてお届けします!
今回のテーマは、OpenAIがスカーレット・ヨハンソン似のAI音声「Sky」を取り下げたです。
なお、以下で実際にお聴きいただくこともできます!
では、よろしくお願いいたします!
GPT-4oの声がスカーレット・ヨハンソンに激似、本人激怒
今日はあるニュース記事を紹介します。
記事のタイトルは「「GPT-4o」の声、スカーレット・ヨハンソン激似に本人激怒 「アルトマン氏のオファー断った」ため似た声優で再現か」です。
先日、OpenAIによるGPT-4oの発表で最も話題となったのが、AIとの自然な音声による会話です。その中で、AIの音声がスカーレット・ヨハンソンさんにとても似ていることが話題になっていました。これに関するニュースとなります。
GPT-4oのおさらい
本題に入る前に、このOpenAIによるGPT-4oの概要をおさらいしたいと思います。この「o」はオムニの「o」とされています。オムニというのは「全ての」や「全体」を表す言葉として使われています。
生成AIの文脈で言うと、マルチモーダルという技術を強調する言葉としてオムニが使われています。これまでの生成AIは、テキストを入力しテキストを返す。つまり入力も出力もテキストだけを扱うものでした。
マルチモーダル技術の可能性
マルチモーダルになると、入力としてテキスト以外に音声、画像、動画など複数のデータを扱えるようになります。そして、出力もテキスト以外に音声、画像、動画などを組み合わせた出力を得ることができます。これがマルチモーダル技術です。
マルチモーダルによって実現できることとして、例えばスマホのカメラで何かを映し、そのスマホのマイクを通して音声で指示を出すと、AIがその音声や画像、映像を受け取り、それに対して音声で返すという、自然なやり取りの体験が可能になります。
今回のOpenAIによるGPT-4oのデモでは、応答速度が速く、歌を歌ったり、時に言い淀んだりと、まるで人と会話をしているような自然なやり取りが話題になりました。
AIの音声「Sky」とスカーレット・ヨハンソン
さて、今回この記事で話題になっているのは、そのAIの音声「Sky」です。このSkyの声が、2013年の映画『her/世界でひとつの彼女』に登場する人工知能OS「サマンサ」のようだと話題になっています。そして、このサマンサの声を担当していたのがスカーレット・ヨハンソンさんでした。
実際、OpenAIがGPT-4oのデモを公開した時に、OpenAIのCEOサム・アルトマン氏はX(旧Twitter)で「her」と一言ポストしていました。
記事によればOpenAIのCEOサム・アルトマン氏は以前、スカーレット・ヨハンソンさんにAI用の声の提供を実際にオファーしていたそうですが、断れていたそうです。
取り下げ要求とOpenAIの対応
しかし、実際に公開されたSkyの声がスカーレット・ヨハンソンさんにとても似ているということで、弁護士を通して取り下げを要求しました。
OpenAIはこの訴えを受けてSkyの声を取り下げましたが、声明ではSkyの声はスカーレット・ヨハンソンさんの模倣ではなく、別のプロの女優が彼女自身の自然な話し声を使ったものと主張しています。
ちなみに、このGPT-4oの音声は全部でSkyを含めて5種類あり、オーディションに5か月をかけて、400人を超える応募者から慎重に選ばれたとされています。
生成AIに関しては、技術の進化が早く、新たな問題が次々と登場する傾向があります。
著作権問題と今後の展望
今回は、AIが生成した音声がリアルの人と似通ってしまうという問題が明らかになっています。OpenAIは今回の訴えを受けて取り下げましたが、著作権の問題は各国でも法的に整備が追いついていないことが多いです。
したがって、社会としてこのような問題が出てきた時にどう解決するかはまだ不明です。悪意のある業者が著名な人の声を無断で使い続けたり、フェイクに使われたりすることもあるかもしれません。
こうした問題にどう対処するかが重要です。また、AIの声が本人に似ているかどうかをどう判断するかという問題もあります。特に声に関わるビジネスに近い人たちにとっては気になるところでしょう。
10年前の映画『her/世界でひとつの彼女』を、OpenAIやサム・アルトマン氏が意識してAIを開発してきたのかもしれません。もしそうだとすると、営利に寄り過ぎたために倫理的に問題があるのではないかとも思います。
特に今、生成AIで言うと世界で最も注目されているトップランナーなので、その辺り信頼を求めたいところですが、やや心配になるニュースです。
皆さんはどのように感じられましたでしょうか。よろしければコメントなどいただければと思います。
ということで、今日はGPT-4oに使われたAIの音声「Sky」に関するニュースをお伝えしました。
まとめ
ということで、今日はVoicy「スキルアップラジオ」の放送から「OpenAIがスカーレット・ヨハンソン似のAI音声「Sky」を取り下げた」をお届けしました。
タカハシのVoicyの放送はこちらからお聴きいただけます。
チャンネルのフォロー、コメント、SNSでのシェアなどなど、楽しみにお待ちしております。
では、また。