– ゲーム、映画、アニメーション、YouTubeなどのコンテンツクリエイター、ユーザー向けAI音声変換サービス
– 10個のキャラクター音声の中から選択してユーザーの声をリアルタイムで変換…今年下半期には正式ローンチを予定
– 自然な音声発話とスピーディな音声変換、細かなカスタマイズなど、世界的な技術力と利便性を備える
AIオーディオ企業のSupertoneは4月15日、ゲームや映画、アニメなど各種コンテンツで活用できるAIベースのリアルタイム音声変換サービス「Supertone Shift」のグローバルオープンベータ版の提供開始を発表しました。
「Supertone Shift」は、Supertoneがコンテンツ制作者やクリエイターの創作をサポートし、業務の利便性を高めるために開発したソリューションです。「Supertone Shift」に搭載された10個のキャラクター音声から一つを選択すると、ユーザーの発話がリアルタイムにキャラクターの声で送出されるようになっています。
今回のオープンベータ版は、Supertoneの公式ウェブサイト(https://product.supertone.ai/shift)から無料でダウンロードして利用することが可能です。Supertoneは、6月26日までのオープンベータ期間を経て、今年下半期に「Supertone Shift」を正式ローンチする予定です。
Supertoneは昨年11月、釜山 BEXCOで開かれた国際ゲーム展示会「GSTA2023」のB2Bブースに参加し、「Supertone Shift」をクローズドベータ形式で初めて公開しました。「Supertone Shift」は展示会で国内外の主要メディアから大きな注目を集め、数多くの来場者がブースを訪れました。
「Supertone Shift」は、▲自然な音声発話スタイル、▲リアルタイムでの音声変換スピードの短縮、▲わずか10秒でユーザーの声をキャラクターの声にカスタマイズする機能の3つの面で高い技術力と利便性を誇っています。
「Supertone Shift」は、実際の人の発話に近い、自然で繊細な音声を実現できるのが特徴です。Supertoneの独自に開発した音声合成基盤モデルNANSY(Neural Analysis & Synthesis)を基に作られた「Supertone Shift」は、ユーザーの音声を音色・発音・音高(ピッチ)・アクセントの4つの構成要素に素早く分析し、ユーザーとキャラクターの声をリアルタイムで変換する方式を適用しています。これにより、機械音はもちろん、外部ノイズを排除し、リアルでクリーンな音声出力が可能となっています。
また、音声を素早く変換し、即時のコミュニケーションをサポートすることも可能です。Supertoneは、音声が出力されて聞き手に届くまでの遅延時間を、聞き手が認識できないレベルである47ms(ミリ秒、1000分の1秒)まで短縮しており、世界的にも優れたレベルを実現しています。
ユーザーの利便性も大幅に向上させており、「Supertone Shift」が音声分析のために提示する10秒程度のサンプルスクリプトをユーザーが読み上げると、選択したキャラクターへの音声変換がすぐに開始されます。同時にカスタマイズも可能で、「Supertone Shift」はユーザーとキャラクターの音声の混合比率や感情の表現度合い、音の高低などの音声構成要素の値を細かく調整できる技術ツールを搭載し、ユーザーの好みや使用目的に合わせた音声を自由に生成することができます。
コンテンツクリエイターは「Supertone Shift」をコンテンツの多様性や完成度を高める創作ツールとして活用することができます。VTuberや配信者、ポッドキャスト配信者などが個性的な声で視聴者に新しいリスニング体験を提供したり、ゲーマーやコスチュームプレイヤーがゲームキャラクターの声で他のユーザーと音声チャットを楽しんでゲームへの没入感を高めるなど様々な体験をサポートします。
Supertone代表のイ・ギョグは「コンテンツ創作支援ツールとしてSupertone Shiftの有用性を最大限に高めることができるよう、様々なクリエイターの意見を集めることが今回のオープンベータ版の目的」であるとし、「正式リリース版では、音声サンプルをさらに拡大し、コンテンツ制作時に便利な機能を追加で搭載するなど、Supertone Shiftが最適な’声の創作ツール’として広く使用されるように努力していきたい」と述べました。
【参考リンク】
「Supertone Shift」ダウンロードリンク:https://product.supertone.ai/shift
【Supertoneとは】
Supertoneは2020年3月に設立されたAIオーディオ技術企業です。現在、HYBEの子会社として様々なメディア分野で最先端のオーディオ技術を提供しています。2022年、HYBE傘下レーベルであるBIGHIT MUSICと、ゲーム事業を展開するHYBE IMと協業して「MIDNATT」プロジェクトを行いました。また、Disney+のドラマシリーズ「カジノ」やNetflixの「マスクガール」などの主人公の声にAI技術を取り入れ、技術力を披露してきました。
2023年にSupertoneが発表したリアルタイムAIノイズ除去プラグイン「Supertone Clear」は198の国と地域のポストプロダクションエンジニアやビデオ編集者、配信者、ミュージシャン、レコードプロデューサーなどのクリエイターに広く受け入れられ、11月のリリースからわずか半年で27,000人以上の月間アクティブユーザーを獲得しました。これに続いて2024年にリアルタイム音声変換サービス「Supertone Shift」を公開し、SupertoneはAI技術企業の域を超え、コンテンツクリエイターに創作ツールを提供する企業へと進化を遂げています。