CloseBox

1993年に創刊したMacUser誌から続けている、松尾公也の私的コラム連載。コンピュータ、ネット、音楽などをテーマに現在と過去を行き来しつつ書いていきます。

著名人の声でテキスト読み上げできるElevenReaderアプリで、「オズの魔法使い」主演に原作小説を日本語で読み上げてもらったら(CloseBox) 画像
テクノロジー

著名人の声でテキスト読み上げできるElevenReaderアプリで、「オズの魔法使い」主演に原作小説を日本語で読み上げてもらったら(CloseBox)

Elevenlabsが、書籍やオンライン記事などを、有名人を含むバラエティに富んだ声で読み上げる無料サービスを提供しています。最近、ここに伝説的なサイケデリックロックバンドであるグレイトフル・デッドのリーダーであったジェリー・ガルシアが加わりました。ミュージシャンの登場は初めてということで、注目を集めています。

「史上最軽量Mac」M4 Mac miniセットを背負って外に持ち出し使ってみた結果(CloseBox) 画像
ガジェット

「史上最軽量Mac」M4 Mac miniセットを背負って外に持ち出し使ってみた結果(CloseBox)

M4 Mac miniが販売初日である11月8日に我が家に届きました。さっそく初期設定をして、翌日の「AIフェスティバル2日目」に持ち出して使ってみました。

M4 Mac miniは史上最軽量モバイルMacにできるのか(CloseBox) 画像
ガジェット

M4 Mac miniは史上最軽量モバイルMacにできるのか(CloseBox)

なぜM4 Mac miniを買ったのか。どのモデルにしたのか、思考の変遷をたどりながら書いていきます。

HeyGenが進化し、20枚の写真から表現力あるAIアバターを作成。OpenAIの多言語ボイスクローン使用か(CloseBox) 画像
テクノロジー

HeyGenが進化し、20枚の写真から表現力あるAIアバターを作成。OpenAIの多言語ボイスクローン使用か(CloseBox)

HeyGenが、20枚以上(10枚程度でも可能)の本人写真・画像があれば、そのアバターを作って、リアルなリップシンクができるようになったのです。さらに、ボイスクローンも。

バーチャルシンガー作り放題・作曲しまくりの新時代到来。AI作曲サービスSunoで「ボーカリスト指名」が可能、自分の声での新曲も(CloseBox) 画像
テクノロジー

バーチャルシンガー作り放題・作曲しまくりの新時代到来。AI作曲サービスSunoで「ボーカリスト指名」が可能、自分の声での新曲も(CloseBox)

歌詞や音楽スタイルを入力すればAIがボーカルを含んだ楽曲を自動生成してくれるサービス「Suno」に待望の新機能が追加されました。「Personas」(ペルソナ)です。

テレビ朝日「ハマスカ放送部」をご覧になった方のためのSuno AI入門(CloseBox) 画像
テクノロジー

テレビ朝日「ハマスカ放送部」をご覧になった方のためのSuno AI入門(CloseBox)

今回のハマスカ放送部のテーマは生成AIによる作曲。ご覧いただいた方に向けて、この回で使った「Suno AI」というソフトの操作方法を軽く紹介します。

Suno AIのiPhoneアプリ、日本のApp Storeに登場。「スノー - AI音楽」で写真やビデオをその場で音楽に(CloseBox) 画像
テクノロジー

Suno AIのiPhoneアプリ、日本のApp Storeに登場。「スノー - AI音楽」で写真やビデオをその場で音楽に(CloseBox)

米国App Storeのみで提供されていた、AI作曲サービスSunoのiPhoneアプリが、日本でも提供開始されました。日本語名は「スノー - AI音楽」。

TSMCも頼る、コンピュータの守護スナック「乖乖」。AIを組み合わせると何が起こる?(CloseBox) 画像
テクノロジー

TSMCも頼る、コンピュータの守護スナック「乖乖」。AIを組み合わせると何が起こる?(CloseBox)

台湾には「乖乖」(Quai Quai)というスナック菓子があります。TSMCをはじめとする台湾企業は世界のコンピュータ産業の中核をなしていますが、彼らがこの乖乖を機械の守護神として扱っているのはご存知でしょうか?

eスポーツと生成AIが融合したらどうなる? 画像生成AIのプロンプトで戦うアーケードゲーム「VS AI街頭對戰」世界大会決勝を審査して感じた未来(CloseBox) 画像
テクノロジー

eスポーツと生成AIが融合したらどうなる? 画像生成AIのプロンプトで戦うアーケードゲーム「VS AI街頭對戰」世界大会決勝を審査して感じた未来(CloseBox)

筆者は先日、今年二度目の台湾旅行をしてきました。前回は、自分の作品が台北当代芸術館(MOCA Taipei)の「Hello, Human!」に展示されるというのでその様子を見に行ったのですが、今回は台湾南部の大都市、高雄市で行われているTTXC(台湾技術文化展示会)に参加するためです。具体的には、TTXCの目玉展示の一つである、対戦型AIアーケードゲーム「VS AI街頭對戰」の世界大会決勝の審査員を務めるというのが目的でした。

グラミー受賞の超大物プロデューサーがAI作曲サービスSuno活用を宣言。ティンバランドによるAIツール支持は反AIに動く音楽業界を揺らすか(CloseBox) 画像
テクノロジー

グラミー受賞の超大物プロデューサーがAI作曲サービスSuno活用を宣言。ティンバランドによるAIツール支持は反AIに動く音楽業界を揺らすか(CloseBox)

主要音楽レーベルがAI作曲サービスのSunoとUdioを提訴したのが6月24日。それから4カ月が過ぎたタイミングで、Sunoがクリエイティブな方向からの反撃を仕掛けました。超大物プロデューサーが活用しているという事例です。

撮影したもの全てを曲にできる、Suno AI iPhoneアプリが人生をサントラ化する(CloseBox) 画像
テクノロジー

撮影したもの全てを曲にできる、Suno AI iPhoneアプリが人生をサントラ化する(CloseBox)

Suno AIの公式iOSアプリに新機能「Scenes」が追加されました。Sunoのモバイルアプリは米国App Storeでしか公開されていませんが、米国App Store専用にしているiPhoneを使い、試してみました。

わずか10秒の元音声でもリアルな「なりきりボイチェン」できる無料ソフト『Seed-VC』は過去最高レベルの再現度か(CloseBox) 画像
テクノロジー

わずか10秒の元音声でもリアルな「なりきりボイチェン」できる無料ソフト『Seed-VC』は過去最高レベルの再現度か(CloseBox)

筆者はUTAUによる波形接続の時代から「その人の声になりきる」技術を試してきましたが、このほど、その中でも画期的と思える技術に出会いました。『Seed-VC』(Seed Voice Conversion)というオープンソースソフトです。

実写もAI動画も2秒だけ伸ばせるAdobe Premiere ProのAI新機能『生成拡張』を試したら、違和感がなさすぎて驚いた(CloseBox) 画像
テクノロジー

実写もAI動画も2秒だけ伸ばせるAdobe Premiere ProのAI新機能『生成拡張』を試したら、違和感がなさすぎて驚いた(CloseBox)

Adobe MAX 2024が始まりました。Sneak Previewについては西田宗千佳さんに速報を執筆いただいているところなのですが、生成AI機能が使えるようになった動画エディターのPremier Proのベータ版がすでに公開されていて試すことができたので、ファーストインプレッションを。

日本人をうまく動かせる動画生成AI「Hailuo」が3日間無制限モード開放中。有償プランスタートに合わせ(CloseBox) 画像
テクノロジー

日本人をうまく動かせる動画生成AI「Hailuo」が3日間無制限モード開放中。有償プランスタートに合わせ(CloseBox)

中国製の動画生成AIサービス「Hailuo」の紹介をし、その中でサブスクリプションサービスが待たれる、と書いていましたが、意外なほど早くきました。本日(10月11日)スタートです。

Suno AIで80年代J-POP偽コンピを作ってみたけど、歌詞間違いのボツがつらい……いや、簡単に部分修正できるようになってるじゃないか(CloseBox) 画像
テクノロジー

Suno AIで80年代J-POP偽コンピを作ってみたけど、歌詞間違いのボツがつらい……いや、簡単に部分修正できるようになってるじゃないか(CloseBox)

これはすごいと話題になっていたYouTube動画。これに対抗しようとやってみました。

動画生成AIにまたもや新星。「Hailuo」は写真を6秒の動画にできて(今のところは)無料。かつ人物の一貫性に優れている(CloseBox) 画像
テクノロジー

動画生成AIにまたもや新星。「Hailuo」は写真を6秒の動画にできて(今のところは)無料。かつ人物の一貫性に優れている(CloseBox)

Image to Video、つまり静止画を短い動画にできる動画生成AIの新サービスが登場しました。中国の「Hailuo」(ハイルオ)がそれで、中国製動画生成AIとしては、KLING、Viduに次ぐ3番手となります。

AIリップシンクのHedraが大幅機能アップの「Character-2」投入。AIミュージックビデオやAIポッドキャストが実用域に(CloseBox) 画像
テクノロジー

AIリップシンクのHedraが大幅機能アップの「Character-2」投入。AIミュージックビデオやAIポッドキャストが実用域に(CloseBox)

AIリップシンクサービスのHedraが新バージョン「Character-2」を公開したので使ってみました。

遅れに遅れたChatGPT高度な音声モードが公開開始されたので、AIパーソナリティーのポッドキャストを作ってみた(CloseBox) 画像
テクノロジー

遅れに遅れたChatGPT高度な音声モードが公開開始されたので、AIパーソナリティーのポッドキャストを作ってみた(CloseBox)

OpenAIがようやくAdvanced Voice Modeのロールアウトを始めました。

AI動画生成もローカルマシンで動かす時代に。Image to Video含め生成し放題のCogVideoを一発インストールできるPinokioという選択肢(CloseBox) 画像
テクノロジー

AI動画生成もローカルマシンで動かす時代に。Image to Video含め生成し放題のCogVideoを一発インストールできるPinokioという選択肢(CloseBox)

話題のオープンソース動画生成AI「CogVideo」をローカルマシンに超簡単インストールできたのです。

AI作曲のSunoがネガティブプロンプト「Exclude Styles」投入「この楽器や歌声いらない」ができて超便利(CloseBox) 画像
テクノロジー

AI作曲のSunoがネガティブプロンプト「Exclude Styles」投入「この楽器や歌声いらない」ができて超便利(CloseBox)

Sunoが投入してきた新機能、ネガティブプロンプト「Exclude Styles」について解説します。

生まれた時にはこの世にいない「写真1枚だけの父親」がAIで動く姿を親父に見せた(CloseBox) 画像
テクノロジー

生まれた時にはこの世にいない「写真1枚だけの父親」がAIで動く姿を親父に見せた(CloseBox)

今年90歳になった僕の父は、自分の父親の記憶がありません。生まれた時には亡くなっていたからです。唯一残された写真をAIで動画にして見せてみました。

80×80×100cmの巨大3Dプリンタ、日本でもクラファン開始。自分が買ったのと同じ低価格で買える?(CloseBox) 画像
ガジェット

80×80×100cmの巨大3Dプリンタ、日本でもクラファン開始。自分が買ったのと同じ低価格で買える?(CloseBox)

「ELEGOO OrangeStorm Giga」という巨大な3DプリンタをKickstarter経由で購入し、自宅に設置している途中の記事を先日書きましたが、その続報です。

AIがカバー曲を作れるように。Suno AI曲の音楽スタイルや歌詞を変えて新しいアレンジで(CloseBox) 画像
テクノロジー

AIがカバー曲を作れるように。Suno AI曲の音楽スタイルや歌詞を変えて新しいアレンジで(CloseBox)

作曲AIサービスのSunoが、新しい機能「Covers」を追加しました。楽曲のアレンジや歌詞を変えた「カバー曲」を作るためのものです。

一貫したキャラクターAI動画生成が超簡単に。LoRAいらず、参照画像1枚だけでいいなんて(CloseBox) 画像
テクノロジー

一貫したキャラクターAI動画生成が超簡単に。LoRAいらず、参照画像1枚だけでいいなんて(CloseBox)

中国産動画生成AI「Vidu」に、Reference to Videoという新機能が加わりました。AI動画生成でObject Consistency、つまり対象物の一貫性を保つことが可能になったのです。

Apple Intelligenceをフル活用するならiPhone 16やApple Watch 10を買わないとダメ?(CloseBox) 画像
テクノロジー

Apple Intelligenceをフル活用するならiPhone 16やApple Watch 10を買わないとダメ?(CloseBox)

今回のAppleの発表で気になるのは、「新製品は、Apple Intelligenceのために必要なものかどうか」です。

高さ1メートルの立体物を印刷できる3Dプリンタが我が家にやってきた(CloseBox) 画像
ガジェット

高さ1メートルの立体物を印刷できる3Dプリンタが我が家にやってきた(CloseBox)

深圳の3DプリンタメーカーELEGOOが2023年12月にKickstarterで実施していたクラウドファンディングにプレッジ(出資)していたのですが、その現物が届きました。「ELEGOO OrangeStorm Giga」という製品です。

プロンプトで画像生成ストリートファイトするAIアーケードゲーム大会「VS AI街頭對戰」、台湾で世界大会決勝(CloseBox) 画像
テクノロジー

プロンプトで画像生成ストリートファイトするAIアーケードゲーム大会「VS AI街頭對戰」、台湾で世界大会決勝(CloseBox)

画像生成AIのプロンプト技を競う世界大会が10月、台湾で開催されます。

AmazonスマイルSALEで買ったもの。Xiaomiの3万円43インチ4Kチューナーレステレビ、買う必要ないのに買ってしまった(CloseBox) 画像
ガジェット

AmazonスマイルSALEで買ったもの。Xiaomiの3万円43インチ4Kチューナーレステレビ、買う必要ないのに買ってしまった(CloseBox)

Xiaomiの43インチテレビ(チューナーなし)がニーキュッパ。2万9800円だというじゃありませんか。買ってしまいました。

Suno酷似のAI作曲サービス「LoudMe」、課金サービス開始したが実態はSunoへの違法アクセスか(CloseBox) 画像
テクノロジー

Suno酷似のAI作曲サービス「LoudMe」、課金サービス開始したが実態はSunoへの違法アクセスか(CloseBox)

AI音楽生成サービス「LoudMe」が、実はSunoから違法にアクセスしているという指摘が浮上。LoudMeはSunoの無料アカウントを利用し、無断で楽曲を生成しているとの情報が公開された。

今そこにある最強動画生成AI「Runway Gen-3 Alpha」が40秒の動画生成可能に。リップシンクもできる(CloseBox) 画像
テクノロジー

今そこにある最強動画生成AI「Runway Gen-3 Alpha」が40秒の動画生成可能に。リップシンクもできる(CloseBox)

Runway Gen-3 Alphaで40秒までの動画生成ができるようになったので、試してみました。

Googleの新画像生成AI『ImageFX』が考える非実在日本アイドル史(1968~83)。超リアルだが全部偽物(CloseBox) 画像
テクノロジー

Googleの新画像生成AI『ImageFX』が考える非実在日本アイドル史(1968~83)。超リアルだが全部偽物(CloseBox)

非常に高性能な画像生成AI「ImageFX(Imagen 3)」の登場です。

最高峰の画像生成AI「FLUX.1」で顔LoRA学習(2ドル)したら、AI動画生成も捗った話(CloseBox) 画像
テクノロジー

最高峰の画像生成AI「FLUX.1」で顔LoRA学習(2ドル)したら、AI動画生成も捗った話(CloseBox)

なんといっても現在のトレンドはFLUX.1。これを自分の制作ワークフローに取り入れることができたのでご報告します。

謎の音楽生成AI「LoudMe」登場。Suno激似で作曲し放題、日本語もOK(CloseBox) 画像
テクノロジー

謎の音楽生成AI「LoudMe」登場。Suno激似で作曲し放題、日本語もOK(CloseBox)

SunoとUdioの2強だったボーカル付きAI作曲サービスに新たなライバル「LoudMe」が登場しました。8月15日に発表されたもののあまり話題になっていなかったサービスですが、その実力は相当なもの。実際に試してその実力を探ってみることにします。

10秒のAI動画を17秒で生成。Runway Gen-3 Alpha Turboの7倍高速化とUnlimitedプランでAI動画のワークフロー激変(CloseBox) 画像
テクノロジー

10秒のAI動画を17秒で生成。Runway Gen-3 Alpha Turboの7倍高速化とUnlimitedプランでAI動画のワークフロー激変(CloseBox)

動画生成AIの老舗、Runwayが新しいモデル「Gen-3 Alpha Turbo」を公開しました。これがすごいのです。

XのチャットAI新バージョン「Grok 2 mini(beta)」の画像生成(実はFLUX.1)を使ってみた(CloseBox) 画像
テクノロジー

XのチャットAI新バージョン「Grok 2 mini(beta)」の画像生成(実はFLUX.1)を使ってみた(CloseBox)

イーロン・マスクが8月12日にほのめかしてた、Xと連動した生成AI「Grok」新バージョンGrok 2 mini(beta)の画像生成機能が、自分のアカウントでも使えるようになりました。

動画と音声ガッチャンコでなんでもAI口パク「sync.」。リップシンクはVideo to Videoの時代に突入した(CloseBox) 画像
テクノロジー

動画と音声ガッチャンコでなんでもAI口パク「sync.」。リップシンクはVideo to Videoの時代に突入した(CloseBox)

AIリップシンクにまた大きな波が訪れました。

高性能すぎて本人証明がないと買えないAIボイチェン「Vocoflex」製品版登場。無限声色ボーカルはAI DTMに欠かせない存在に(CloseBox) 画像
テクノロジー

高性能すぎて本人証明がないと買えないAIボイチェン「Vocoflex」製品版登場。無限声色ボーカルはAI DTMに欠かせない存在に(CloseBox)

しばらくベータテスターをしていた、DreamtonicsのAIボイスチェンジャー「Vocoflex」。その製品版がついにリリースされたので、購入しました。

1枚の人物写真から動画生成できる、4つの最新AIモデルを比較。Luma、Runway、KLING、Viduの結局どれがいい?(CloseBox) 画像
テクノロジー

1枚の人物写真から動画生成できる、4つの最新AIモデルを比較。Luma、Runway、KLING、Viduの結局どれがいい?(CloseBox)

1枚の人物画像から動画を生成するAIモデルが4種類、揃いました。Luma AI Dream Machine、Runway Gen-3 Alpha、KLING、Vidu。これらを同じ人物写真(画像)、同じプロンプトで比較してみます。

高性能動画生成AI「Vidu」の実力を試す。Character to Videoとは何か。KLINGやRunwayとはどこが違うのか(CloseBox) 画像
テクノロジー

高性能動画生成AI「Vidu」の実力を試す。Character to Videoとは何か。KLINGやRunwayとはどこが違うのか(CloseBox)

KLINGのサブスクリプションが開始されたばかりですが、翌日の7月31日に早くもライバルが登場しました。同じく中国の動画生成AIサービスで、「Vidu」というものです。といってもぽっと出ではなく、4月末辺りからSoraクラスの動画生成AIとして発表され、注目はされていました。このViduが一般利用可能になったのです。

Runway Gen-3でImage to Videoとリップシンク生成可能に。これは現時点最強のAI動画モデルなのか?(CloseBox) 画像
テクノロジー

Runway Gen-3でImage to Videoとリップシンク生成可能に。これは現時点最強のAI動画モデルなのか?(CloseBox)

7月30日、動画生成AIサービスの老舗であるRunwayが、最新モデルであるGen-3 AlphaでImage to Videoを使えるようにしました。

人物Image to Videoの進化がすごい。Luma、Runway、KLING、HeyGenの最新動画生成AIをVision Proの空間ミュージックビデオで見る(CloseBox) 画像
ガジェット

人物Image to Videoの進化がすごい。Luma、Runway、KLING、HeyGenの最新動画生成AIをVision Proの空間ミュージックビデオで見る(CloseBox)

動画生成AIはわずか1カ月ちょっとで急激な進化を遂げました。この期間の進化を、人物Image to Videoに絞ってまとめてみます。

AI作曲UdioとChatGPTで甦る昭和歌謡。1973年のヒット曲とカラオケ本人映像をAIで捏造した(CloseBox) 画像
テクノロジー

AI作曲UdioとChatGPTで甦る昭和歌謡。1973年のヒット曲とカラオケ本人映像をAIで捏造した(CloseBox)

音質が爆上がりして長さも2分10秒と完成曲が作りやすくなったUdio。1970年代初期のバラード(ユーミンとか)を作ろうと思ってやってみたら、なぜか昭和歌謡っぽいものを連発してきました。