
PerplexityがDeep Research提供開始。無料ユーザーでも1日5回、Proなら500回利用可能に。実際に試してみた(CloseBox)
統合型チャットAIサービスであるPerplexityが新サービスをリリースしました。「Deep Research」オプションの追加です。

ワープ、ハイパードライブ、無慣性航法からアルクビエレ・ドライブまで、超光速(FTL)移動技術に関するdeep research調査報告をベッドの中から作らせた(CloseBox)
超光速。FTL(Faster Than Light)とも呼ばれることがある、SFファンならおなじみの移動手段です。それに近い技術をどこかが開発したとか実現不可能だと分かったとか、断片的な報道がたまにされています。

アドビ、FireflyでAI動画生成スタート。「Firefly Video Model」はImage to Video、End Frameもサポートするが、月額1580円の価値はある?(CloseBox)
アドビが2月13日、AI動画生成サービス「Firefly Video Model」を一般公開しました。1920×1080の解像度で5秒間の生成が可能。テキストプロンプトだけでなく、Start FrameとEnd FrameをサポートしたImage to Videoも使えます。

ChatGPTがタメ口回答するようになった。AGIやってきたってこと? deep research調査の結論は(CloseBox)
ChatGPTの応答が昨日あたりからちょっとおかしいことに気づきました。馴れ馴れしすぎるのです。

オープンソースAI作曲ソフト「YuE」にGUIがついた。簡単Windowsインストーラーが2種登場。その影響もAIが深堀り考察した(CloseBox)
香港科技大学などが開発したオープンソースのAI作曲ソフト「YuE」が発表されて数日経ちました。筆者はWindowsでのインストールができずにWSL2のLinux環境で実行できるようになりましたが、いまだに一定のスキルは必要なようです。

読みたい分析記事がない? なら「deep research」に書かせればいいじゃない。OpenAIとGoogle Geminiにそれぞれ深掘り調査してもらった結果(CloseBox)
OpenAIがChatGPTの新機能としてdeep researchを投入しました。筆者が常日頃考えているテーマを深掘り検索してもらいました。同様の機能はGoogle Geminiもあるのでそちらにも同じ質問を投げました。

ChatGPT新AIモデル「o3-mini」で、ビデオ出力ないRiffusionやYuEのAI楽曲を簡単にかっこよくビジュアライズするツールを開発した(CloseBox)
先週の土曜日早朝、AI研究家の清水亮さんが興奮して「o3-miniすごい」「自分だけではそのポテンシャルを実感できないからハッカソンやろう」と言ってるのに居合わせ、自分もそのハッカソンに出ることになりました。

日本語プロンプトで高音質生成できるAI作曲サービス「Riffusion」はSunoを超えたか? 4パートのSTEMあり、現在無料無制限(CloseBox)
サンフランシスコベースのスタートアップ がAI作曲サービス「Riffusion」のパブリックベータを公開しました。

SunoのAI作詞支援機能が便利すぎるから、みんな使うといいよ(CloseBox)
Sunnoの新しい歌詞エディタの出来がすごく良いので紹介します。

オープンソースAI作曲ソフトがインストール出来るヤァヤァヤァ!。話題の「YuE」を自分のPCに入れて日本語ボーカル曲を生成してみた(CloseBox)
中国開発のオープンソース謳うAI作曲ソフト「YuE」。まだ謎が多いですが、自宅のPCにインストールして楽曲を生成できたので、そのAI作曲体験をまとめました。

歌えるAI作曲ソフトにオープンソースの波。SunoとUdioのライバル「YuE」は日本語楽曲にも対応(CloseBox)
オープンソース版でSuno並に品質が高くて歌もうたえるAI作曲ソフト「Yue」をMultimodal Art Projectionと香港科技大学(HKUST)が共同開発しました。

複雑なタスクをブラウザでこなすOpenAIのAIエージェント「Operator」を使ってみてわかった限界点(CloseBox)
米国のChatGPT Proユーザーのみに開放されているOpenAIのAIエージェント「Operator」を試してみました。

OpenAI、ブラウザ操るAIエージェント「Operator」を発表。ユーザーの代わりに複雑なタスクを処理し、ユーザーの介入も可能
OpenAIは1月23日(米国時間)、ユーザーの代わりにブラウザを操作してタスクを実行するAIエージェント「Operator」を発表しました。

顔芸リップシンク、4Kアップスケールから顔修復まで。最近の動画生成AIおもしろ新機能を駆使してみた(CloseBox)
毎月13万円をかけている生成AIサブスクですが、特に動画方面で、ちょこちょことアップデートがされています。今回はその辺で気になるところを試してみます。

NVIDIAのMac mini激似AIスーパーコンピュータ「Project DIGITS」が欲しいです、革ジャン先生(CloseBox)
また欲しいものが出てしまいました。Mac miniっぽいスーパーコンピュータ。

夢の続きをAIに語らせてみた(CloseBox)
2025年1月6日朝に見た夢の続きをChatGPT o1 pro modeに短編スタイルで書いてもらいました。

AIコンテンツ自給自足はもう始まっている。ChatGPT連載小説とAIエージェント「browser-use」がもたらす未来(CloseBox)
AI小説の執筆、だいぶ慣れてきました。そして、browser-useというソフトが面白いです。

半年でAI関連課金が2倍に。生成AIサブスク地獄から脱出できる?(CloseBox)
みなさん、AIサブスクしてますか?

92万字の大作小説をChatGPT o1 pro modeに書かせたら、罪悪感でいっぱい。そして驚愕の結末に(CloseBox)
最近、AIに小説を書いてもらっています。

VOCALOID発売から20年。ChatGPTに歌声合成の歴史をまとめてもらった(CloseBox)
VOCALOIDが発売から20年を迎え、ヤマハの特設ページが公開されました。継続的にVOCALOIDの新技術を試して記事にしていた筆者もお祝いのメッセージを書いています。

音楽・動画AIの進化が加速した2024年の生成AIを記事とビデオとポッドキャストで振り返る(CloseBox)
今年2024年は生成AIの、特に動画において画期的な進歩が継続して行われた年でした。この連載でもずっと追いかけてきたテーマでもあるので、特に動画生成AIについて、自分が作った動画で振り返ります。

ローカルマシンだけで生成AIはどこまでいける? MacBook Pro(M4 Max、128GBメモリ)を手に入れたローカルAI男子の遠吠え(2024年ベストバイ)
128GB M4 Max MacBook Pro、予約しただけで記事を書いた私ですが、ようやく届いたので、いろいろとやりたかったことを試しています。

忘年会でオーバー60の人たちにAIボイチェンとAIミュージックビデオを披露した結果(CloseBox)
先週の土曜日は、大学時代の軽音サークルの忘年会ライブがありました。そこで筆者も演奏したのですが、今年はAIリアルタイムボイチェンと、AIを使ったミュージックビデオを披露しました。

長編ドキュメンタリー作品「AIで愛になる~超愛妻家・松尾公也とテクノロジーの未来」が公開されます(CloseBox)
自分の半生を描いたドキュメンタリー作品がYouTubeで公開されます。

ChatGPTでサンタさんとの音声会話ができるように。iPhoneだけでGoogle Stream Realtime対抗のビデオ・画面共有会話もやってみた(CloseBox)
OpenAIが12日間、新機能を発表する「12 Days of OpenAI」、6日目はChatGPTのAdvanced Voice Mode(高度な音声)の新機能について。

iPhoneだけでAI画像生成できる、Apple IntelligenceのImage Playgroundが使えるiOS 18.2で、ChatGPTとSiriの統合を試してみた(CloseBox)
Apple Intelligenceはまだ日本語では使えませんが、英語モードにすれば利用可能です。本日アップデートされたiOS 18.2ではChatGPTとの統合に加え、待望のAI画像生成機能「Image Playground」が追加されました。その機能を試してみます。

「登場即ライバル動画生成AI死亡」ではなかった。使ってわかったSoraの品質と限界(CloseBox)
人気のため一時はアカウント作成ができない状態だったSoraですが、ようやくアカウントを作成し、ログインできたので試してみました。

OpenAIのSora、1080p 最大20秒の動画生成AI最高水準でついに一般公開。3万円コースのChatGPT Proユーザーは無制限モードあり(CloseBox)
OpenAIの動画生成AI「Sora」がついに公開されました。

OpenAIアドベントカレンダーこと「12 Days of OpenAI」、スタート。Day 1はChatGPT Pro(月額200ドル)とo1完全版(CloseBox)
OpenAIアドベントカレンダーこと「12 Days of OpenAI」、が始まりました。初日はChatGPT Pro(月額200ドル)とo1完全版を発表しました。

OpenAI、今夜から12回の(ウィークデー)ライブ発表を予告。やっとSoraが使えるようになるの?(CloseBox)
毎年この時期に大きな発表をするのが慣例となっているOpenAIですが、今年は1回では収まらず、12日連続(ただしウィークデーのみ)のライブストリーミングで行うことをXへのポストで予告しています。

夢の中へ行ってみたいと思ったのでAIで再現してみた(CloseBox)
今朝見た夢をAIで再現しようと思います。

2024年最大の散財、新しい俺の相棒「M4 Max MacBook Pro」を紹介するぜ(CloseBox)
猫も杓子も128GB M4 Max MacBook Proなのはどういうことでしょうか。

AIオリジナル曲のリップシンクミュージックビデオを爆速で作る方法(CloseBox)
「最も簡単にオリジナル曲のリップシンクミュージックビデオを作る方法」について解説します。まあ、自分で弾き語りするのが一番簡単なんですが、それは置いといて(笑)

AI動画生成のLuma Dream MachineがUI刷新してキャラバリなど大幅機能追加したので試してみた(CloseBox)
Luma AIは動画生成AIサービスのDream Machineに大きな改変を施しました。

新世代AI読み上げソフトAivisSpeech、Style-Bert-VITS2とHeyGenアバターでレシピ動画を超簡単に料理してみた(CloseBox)
AivisSpeechとは、日本で開発されたAI音声合成ソフトで、いくつかのプリセットボイスが使える推論用アプリがMac、Windows向けに提供されており、すぐに試すことができます。

「写真はイメージです」を撲滅したいので、Gemini LiveとChatGPTとおしゃべりして解決策を探った(CloseBox)
GeminiとChatGPTに、「写真はイメージです」という表現の代替案を考えてもらいました。

超軽量折り畳みキーボード「nanoKEY Fold」がコルグから登場。フォルダブルキーボードマニアとしては買わずにいられない(CloseBox)
コルグの新しいMIDIキーボードは126グラムで、折りたたみ時147 x 73 x 17mm、使用時282 x 73 x 14mm。でもそれだけではない。

これはもう人間? Suno v4の音質向上は本物か、過去バージョンもリマスターしてみた(CloseBox)
テキストの指示で楽曲を完成することができるAI作曲サービス「Suno」が、v4にメジャーバージョンアップされました。最大のポイントは音質向上です。

この画質をローカルマシンで? オープンソース動画生成AI「Pyramid Flow」は商用サービスにどのくらい迫っているのか確かめてみた(CloseBox)
動画生成AIはRunwayを筆頭に、中国系サービスも参入し、激しい開発競争を繰り広げていますが、オープンソースソフトもかなりのレベルに到達しています。

著名人の声でテキスト読み上げできるElevenReaderアプリで、「オズの魔法使い」主演に原作小説を日本語で読み上げてもらったら(CloseBox)
Elevenlabsが、書籍やオンライン記事などを、有名人を含むバラエティに富んだ声で読み上げる無料サービスを提供しています。最近、ここに伝説的なサイケデリックロックバンドであるグレイトフル・デッドのリーダーであったジェリー・ガルシアが加わりました。ミュージシャンの登場は初めてということで、注目を集めています。

「史上最軽量Mac」M4 Mac miniセットを背負って外に持ち出し使ってみた結果(CloseBox)
M4 Mac miniが販売初日である11月8日に我が家に届きました。さっそく初期設定をして、翌日の「AIフェスティバル2日目」に持ち出して使ってみました。

M4 Mac miniは史上最軽量モバイルMacにできるのか(CloseBox)
なぜM4 Mac miniを買ったのか。どのモデルにしたのか、思考の変遷をたどりながら書いていきます。
- 296件中 1 - 42 件を表示
- 次へ