本記事は、人工知能(AI)と最新技術に関するAvid独占シリーズの第1回目です。Avidでは、この最新技術のパワーをイノベーションに活用し、お客様をサポートしています。このホットな話題に関する詳細は、AvidサイトのAIと最新技術に関するリソースページをご覧ください。
人工知能(AI)について、Avidはどのように取り組んでいるのか?これは、世界中のメディア企業から最も多く寄せられる質問です。
Avidでは数々の取り組みを行っています。10年ほど前から、AIをさまざまな形で製品に搭載してきました。新技術を最大限に活用する方法にフォーカスした研究ラボも作りました。実際、映画テレビ技術者協会が発行するSMPTE Motion Imaging Journalの2023年4月号には、AI関連の研究論文が3本掲載されました。これについては、後述します。
AIはメディア制作にどのような影響を与えていくのか、それについてAvidがどのように取り組んでいるのか、そしてそれが業界にとって何を意味するのかを知るため、Avidのメディア技術エキスパート、アーキテクチャ&テクノロジー担当バイスプレジデントのシャイレンドラ・マーサーと、AIファンであるエンジニアリング・フェローのロブ・ゴンザルベスの2人に話を聞きました。
Q. メディア制作におけるAIの活用について、Avidの顧客は何を求めているのでしょうか?
A. メディア業界のあらゆる分野の顧客の間で、AIはホットな話題です。メディアコンテンツ制作におけるAIと機械学習(ML)の応用の可能性は、大きな関心を集めています。AIやMLがもたらす斬新な制作の可能性と、テクノロジーが時間のかかる作業を自動化して、どれだけワークフローを合理化し、効率を高めることができるかということに、人々は胸躍らせています。例えば、重複するコンテンツが大量にある場合、メタデータの強化や重複排除にAIを使うことができます。
Q. AIには、仕事場で人の代わりになる知能や能力がありますか?
A. AIが仕事を奪うのではないかと不安視されていますが、Avidは、AIが革新的な技術として、仕事のやり方を変えると信じています。Avidは、AIが制作アシスタントとして効率性を高める役割を果たす分野にフォーカスしたいと考えています。映画のアイディアを出すことから制作支援まで、AIは、コンテンツ制作のあらゆる段階を支援することができます。これらの進化は、メディア制作において新たなプロセスの誕生を促進します。
Q. Avidでは、既に10年以上AIに取り組んでいますが、どのように取り組んできたのでしょうか?
A. AIがあり、MLがあります。Avidは、PhraseFindやScriptSyncなど、AIをソリューションに取り入れた最初の企業の1つです。AvidはMicrosoftとAI関連のパートナーシップを結び、アセット管理マネジメントソリューションにMicrosoftのAzure Media Indexerを統合しています。このAIツールは文字起こしの機能や、お客様が保有する豊富な映像のロゴや人物の顔などの要素を自動識別することができます。ある場面の人の数や、昼間のシーンか夜間のシーンかを判別することもできます。通常なら手作業で情報を記録しなければならない面倒な雑用です。また、Avidはx.newsなどのアライアンス・パートナーと協力して、AIによるソーシャル・メディア検索用のAIツールを発表しています。これにより、記者やプロデューサーは、トピックに基づき効率的に検索することができます。
ここ数年、Avidはビデオ編集、メディア・インジェスト、分析、メタデータ入力の自動化、音楽制作および作曲、アーカイブ、現場でのAIの活用について研究してきました。その成果は、自社の製品ロードマップに反映させるだけでなく、公開して、メディア業界と共有しています。
Avidが活用しているAIの新たな展開は、セマンティック音声検索というデータ検索技術です。キーワードや検索クエリの背後にある意図や意味を解釈して、言葉のニュアンスを判断します。他の例では、OpenAIであるWhisperがあります。これは、多言語版も含め、音声からテキストへの文字起こしを行います。優れたクオリティで、約100の言語に対応します。適切に文字起こしされると、クローズド・キャプションや字幕の作成、検索が可能になります。トランスクリプトがしっかりしていれば、読んで、ざっと目を通し、探して、必要なものを選ぶことができます。それから、プロジェクトに必要なフレーズや会話を選ぶことができます。文字起こしは、会話が多くて台本が無く、要約する必要がある素材に役立ちます。
Q. Avidの制作におけるAIの可能性の研究はどのように進んでいますか。
A. AIの研究は飛躍的に進んでいます。一年前にはできなかったことが、今ではスピーディにできます。今は、物事が急速に進み。システムも改善しています。ワクワクします。
Avidでは重要分野に重点を置いて、制作におけるAIの活用を模索しています。第一は、顧客が何を求めているかを理解することであり、Avidは顧客との継続的な対話によってこれを達成します。マシンが多機能であっても、顧客には必要がない、あるいは望んでいない場合もあります。あるいは、マシンがまだできないことを望んでいるかもしれません。最新のAI技術やMLシステムができること、どうすれば効率的に顧客のニーズに対応できるかを理解するために、常に最新の研究情報を得ています。Avidはこれらの機会を研究開発の対象にします。Avidは、個々の対話に加え、Avid Community Association (ACA)を通じてさまざまなお客様と交流しています。ここ数カ月の間に、ChatGPTやOpenAIがAI生成ツールを誰にでも利用可能にしたことで、お客様との会話が爆発的に増えました。情報の一部を製品のロードマップに反映させるだけでなく、製品グループ以外の調査もRADラボと言うところで行っています。
Q. AIは、今後どのような方向に進んでいくと思いますか?
A. AIは飛躍的に成長し、メディア制作に変革をもたらすと期待されています。プロジェクトの状況分析に基づいて関連するクリップやセグメントを提案したり、大量の映像や音声ファイルを扱うクリエイターのアシスタントのような役割を担う日が来るかもしれません。AIはまた、色補正、再フォーマット、オーディオでの同様の作業など、ビデオやオーディオの処理にもますます関わってくるでしょう。シーンやプロジェクトの概容についてアイディアを出し、制作の方向性を決める手助けして、プリプロの段階をサポートするかもしれません。

HPA 2023で紹介されたように、生成AI技術によって、音楽、映画、テレビ、脚本、物語の創作は、制作のプロセスを支援する提案によって、より創造的かつ効率的になります。アセットおよびメタデータの管理は、ナレッジ管理技術を使ってリンクされたコンテンツ・ベースのものに変わるでしょう。2023年4月号のSMPTE Motion Image Journalで考察されたように、検索領域は、キーワードとの単純な一致よりも、より文脈に基づいた質の高い結果を提供するクエリへと変わるでしょう。メディアの運用は、データと分析に基づいて自動化されていくでしょう。コストの削減は、メディア制作の様々な部分をより効率的にコントロールする見識によって可能になります。アプリケーションとのやり取りは、UIのボタンクリックに頼るのではなく、やりたいことを自然な言語で記述する分かりやすい形に変わっていくでしょう。
明るい見通しがあるのと同じくらい、将来的な課題も多くあります。人間のやり方を模倣するAIシステムがその精度を高めると、人の創造性はその仕事量に埋もれてしまうのでしょうか?それとも、それによって人は創造性をより高い形に進化させることができるのでしょうか?責任あるAIおよびAI倫理の分野も重要なテーマです。生成AIの世界で、アトリビューションはどのように作用するのでしょうか?ゆがめられた学習データによってモデルが偏っていないことを、どうやって確認すればよいのでしょうか?
7月31日まで、SMPTE Motion Imaging Journalコンテンツを特別公開
AvidのAI研究については、SMPTEが提供する期間限定のチャンスを是非ご利用ください。AvidのAI研究者による高精度で効率的なファイル検索法に関するSMPTE Motion Imaging Journal掲載論文『Machine Learning Applied to Media Libraries for Insights, Search, and Segmentation(メディア・ライブラリのインサイト、検索、区分けに応用する機械学習)』を期間中、無償でお読みいただけます。公開は7月31日までです。サイトを訪れたら、是非SMPTEにご加入ください。SMPTEは、世界中のメディア&エンターテインメント業界で働く才能で構成される素晴らしい組織です。AvidのAIへの取組みに関する詳細はこちらをご覧ください。AvidのRADラボが行っている画期的な取り組みを紹介します。