
読みたい分析記事がない? なら「deep research」に書かせればいいじゃない。OpenAIとGoogle Geminiにそれぞれ深掘り調査してもらった結果(CloseBox)
OpenAIがChatGPTの新機能としてdeep researchを投入しました。筆者が常日頃考えているテーマを深掘り検索してもらいました。同様の機能はGoogle Geminiもあるのでそちらにも同じ質問を投げました。

OpenAI「o3-mini-high」でゲーム生成祭り o1より高速、低料金、コーディング能力が高く気軽に生成(生成AIクローズアップ)
今回は、OpenAIが1月31日(現地時間)に発表した「o3-mini」を取り上げます。

オープンソースAI作曲ソフトがインストール出来るヤァヤァヤァ!。話題の「YuE」を自分のPCに入れて日本語ボーカル曲を生成してみた(CloseBox)
中国開発のオープンソース謳うAI作曲ソフト「YuE」。まだ謎が多いですが、自宅のPCにインストールして楽曲を生成できたので、そのAI作曲体験をまとめました。

複雑なタスクをブラウザでこなすOpenAIのAIエージェント「Operator」を使ってみてわかった限界点(CloseBox)
米国のChatGPT Proユーザーのみに開放されているOpenAIのAIエージェント「Operator」を試してみました。

OpenAI、ブラウザ操るAIエージェント「Operator」を発表。ユーザーの代わりに複雑なタスクを処理し、ユーザーの介入も可能
OpenAIは1月23日(米国時間)、ユーザーの代わりにブラウザを操作してタスクを実行するAIエージェント「Operator」を発表しました。

顔芸リップシンク、4Kアップスケールから顔修復まで。最近の動画生成AIおもしろ新機能を駆使してみた(CloseBox)
毎月13万円をかけている生成AIサブスクですが、特に動画方面で、ちょこちょことアップデートがされています。今回はその辺で気になるところを試してみます。

AIでフリーランスの収入が「減る職種」と「増える職種」。その境目にある“変曲点”とは?(生成AIクローズアップ)
今回は、AIがフリーランス(オンライン)の各仕事にどのような影響を及ぼし、職種による違いを分析した論文「AI and Freelancers: Has the Inflection Point Arrived?」に注目します。

ChatGPTで動作するセントリーガンを作った男、OpenAIにAPIアクセスを遮断される
OpenAIは、ChatGPTの音声コマンドを利用して動作する電動セントリーガン(全自動回転砲塔)を開発する様子をSNSに投稿していたユーザーのAPIアクセスを遮断したと発表しました。

夢の続きをAIに語らせてみた(CloseBox)
2025年1月6日朝に見た夢の続きをChatGPT o1 pro modeに短編スタイルで書いてもらいました。

AIコンテンツ自給自足はもう始まっている。ChatGPT連載小説とAIエージェント「browser-use」がもたらす未来(CloseBox)
AI小説の執筆、だいぶ慣れてきました。そして、browser-useというソフトが面白いです。

92万字の大作小説をChatGPT o1 pro modeに書かせたら、罪悪感でいっぱい。そして驚愕の結末に(CloseBox)
最近、AIに小説を書いてもらっています。

VOCALOID発売から20年。ChatGPTに歌声合成の歴史をまとめてもらった(CloseBox)
VOCALOIDが発売から20年を迎え、ヤマハの特設ページが公開されました。継続的にVOCALOIDの新技術を試して記事にしていた筆者もお祝いのメッセージを書いています。

ローカルマシンだけで生成AIはどこまでいける? MacBook Pro(M4 Max、128GBメモリ)を手に入れたローカルAI男子の遠吠え(2024年ベストバイ)
128GB M4 Max MacBook Pro、予約しただけで記事を書いた私ですが、ようやく届いたので、いろいろとやりたかったことを試しています。

ChatGPTでサンタさんとの音声会話ができるように。iPhoneだけでGoogle Stream Realtime対抗のビデオ・画面共有会話もやってみた(CloseBox)
OpenAIが12日間、新機能を発表する「12 Days of OpenAI」、6日目はChatGPTのAdvanced Voice Mode(高度な音声)の新機能について。

iPhoneだけでAI画像生成できる、Apple IntelligenceのImage Playgroundが使えるiOS 18.2で、ChatGPTとSiriの統合を試してみた(CloseBox)
Apple Intelligenceはまだ日本語では使えませんが、英語モードにすれば利用可能です。本日アップデートされたiOS 18.2ではChatGPTとの統合に加え、待望のAI画像生成機能「Image Playground」が追加されました。その機能を試してみます。

「登場即ライバル動画生成AI死亡」ではなかった。使ってわかったSoraの品質と限界(CloseBox)
人気のため一時はアカウント作成ができない状態だったSoraですが、ようやくアカウントを作成し、ログインできたので試してみました。

OpenAIアドベントカレンダーこと「12 Days of OpenAI」、スタート。Day 1はChatGPT Pro(月額200ドル)とo1完全版(CloseBox)
OpenAIアドベントカレンダーこと「12 Days of OpenAI」、が始まりました。初日はChatGPT Pro(月額200ドル)とo1完全版を発表しました。

「写真はイメージです」を撲滅したいので、Gemini LiveとChatGPTとおしゃべりして解決策を探った(CloseBox)
GeminiとChatGPTに、「写真はイメージです」という表現の代替案を考えてもらいました。

「生成AI vs. 著名な詩人」どっちの詩が好き? シェイクスピアやディキンソンなどとAI詩を比較(生成AIクローズアップ)
AIが生成した詩と詩人による作品とが区別できるのか、またどちらが好まれるかを調査した論文「AI-generated poetry is indistinguishable from human-written poetry and is rated more favorably」に注目します。

ChatGPT searchはGoogle検索の脅威となるか? 試してわかったこと(Google Tales)
OpenAIがSearchGPTの提供を開始したことが、すわGoogle検索キラーの本命か、とかなり話題になっておりました。Googleも、かなり危機感を持っていると思います。

TSMCも頼る、コンピュータの守護スナック「乖乖」。AIを組み合わせると何が起こる?(CloseBox)
台湾には「乖乖」(Quai Quai)というスナック菓子があります。TSMCをはじめとする台湾企業は世界のコンピュータ産業の中核をなしていますが、彼らがこの乖乖を機械の守護神として扱っているのはご存知でしょうか?

Suno AIで80年代J-POP偽コンピを作ってみたけど、歌詞間違いのボツがつらい……いや、簡単に部分修正できるようになってるじゃないか(CloseBox)
これはすごいと話題になっていたYouTube動画。これに対抗しようとやってみました。

AIリップシンクのHedraが大幅機能アップの「Character-2」投入。AIミュージックビデオやAIポッドキャストが実用域に(CloseBox)
AIリップシンクサービスのHedraが新バージョン「Character-2」を公開したので使ってみました。

Notihng、初のオープン型イヤホン「Ear (open) 」正式発表。ChatGPT連携も対応、2万4800円
英国のテクノロジーブランドNothingは、フルワイヤレスイヤホンの新製品「Ear (open) 」を発表しました。税込価格は2万4800円となっています。

遅れに遅れたChatGPT高度な音声モードが公開開始されたので、AIパーソナリティーのポッドキャストを作ってみた(CloseBox)
OpenAIがようやくAdvanced Voice Modeのロールアウトを始めました。

AIが量産するデータで何度も学習するAIは「モデル崩壊」する研究結果、SD級の大型画像生成AIを「約29万円」「2.6日」の高コスパで訓練できるSonyAI開発「MicroDiT」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第57回)では、生成AIが生成したコンテンツを生成AIが学習し続けると性能低下が見られ、モデル崩壊が起きるという研究報告を取り上げます。また、Sony AIが大型の画像生成AI(11.6億パラメータ)の訓練を8台のNVIDIA H100 GPUを使用してわずか2.6日で完了し、しかもそれが約29万円という高いコストパフォーマンスを達成した手法「MicroDiT」をご紹介します。

AI作曲UdioとChatGPTで甦る昭和歌謡。1973年のヒット曲とカラオケ本人映像をAIで捏造した(CloseBox)
音質が爆上がりして長さも2分10秒と完成曲が作りやすくなったUdio。1970年代初期のバラード(ユーミンとか)を作ろうと思ってやってみたら、なぜか昭和歌謡っぽいものを連発してきました。

OpenAI、独自検索エンジン「SearchGPT」公開。招待制の期間限定試作、ChatGPTと統合へ
OpenAIが、うわさの独自検索エンジン「SearchGPT Prototype」の試験運用を開始しました。

万能系Artifacts登場。「Poe Previews」ならGeminiもGPT-4もClaudeもAI共同開発者にできる(CloseBox)
このところプログラミングの楽しみを覚えて毎日Claude ArtifactsとChatGPT Artifactsで遊んでいる筆者ですが、またまた新しいツールに出会ってしまいました。

ChatGPT Artifactsができた? GPT-4oでもClaudeみたいな楽しいプロンプト開発ができるのだ(CloseBox)
大規模言語モデルのClaudeが送り出した新機能、Artifactsを使った記事が思いのほか好評のようですが、問題が一つ。使用量制限がかかってしまい、次のアクションまで数時間待たされることが頻発しているのです。

Apple Intelligenceはどのように開発されたのか? 中核をなすオンデバイスAIモデルとPrivate Cloud Computeについて今わかっていること(CloseBox)
アップルが打ち出したAIフレームワーク「Apple Intelligence」ですが、個々の機能についてはわかるものの、全体像がつかみにくいものになっています。

本来あるべきSiri、AIを統合したOS。Apple Intelligenceの未来を見た僕がCopilot+ PCの検討を始めた理由(CloseBox)
アップルの開発者会議「WWDC24」基調講演の後半は、主要プラットフォームへの生成AI統合の話に終始しましたが、日本では来年になるまで使えません。

アップルのAI『Apple Intelligence』まとめ。ChatGPTもOS統合 iPhone 15 ProかM1以降必須
開発者イベントWWDC24で、Appleがうわさの独自AIシステム『Apple Intelligence』を発表しました。

AI作曲「Suno」新バージョンがWAV高音質化、最長4分の曲を一発でエンディングまで完成。無修正で良曲量産可能に(CloseBox)
このところUdioやSonautoの新機能搭載で押され気味だったAI作曲サービスの「Suno」が反撃に出ました。

GPT-4o vs. Project Astra。マルチモーダルLLM戦争を語るポッドキャスト第55回を配信(TechnoEdge-Side)
テクノエッジ編集部では、人気のテック系ポッドキャスト「backspace.fm」の中に「TechnoEdge-Side」(テクノエッジ・サイド)というチャンネルを設け、週1回のペースでお届けしています。

中国で『AI習近平』誕生。「習近平思想」記した著書十数冊や公式文書で強化
中国国家サイバースペース管理局(CAC)は、習近平国家主席の思想と政治哲学に関する著書などでトレーニングされた大規模言語モデル(LLM)を搭載するAIシステムを開発しました。

スカヨハ、ChatGPTの声提供をサム・アルトマンから繰り返し提案され断っていたと明かす。そっくりの『Sky』には衝撃と怒りを声明
ハリウッドスターのスカーレット・ヨハンソンは、声の使用を断ったにもかかわらずOpenAIが「不気味なほど自分に似た」AI音声を発表したことに「ショックを受け、怒り」を覚えたと述べ、同社のサム・アルトマンCEOに対し「信じられない」とする声明を出しました。

OpenAI、ChatGPTのMacアプリ公開。Macのカメラやスクショ、写真ライブラリにもアクセスし音声対話可能
OpenAIはChatGPTのGPT-4oを使えるマルチモーダルなMacアプリを公開した。

OpenAI、ChatGPTの新バージョン「GPT-4o」を発表。無料ユーザー向けにも提供、感情豊かな音声で応答、歌いながら回答も
OpenAIは5月13日(米国時間)、オンラインでSpring Updateイベントを開催。その中で、フラグシップとなる大規模言語モデル「GPT-4o」を発表しました。APIでの提供も行い、現行のGPT-4 Turboと比べて2倍高速、価格は50%安価に、レートリミットは5倍に拡張されています。

OpenAI日本オフィス誕生で何が変わる?日本語最適化の本当の狙いを読み解く(本田雅一)
4月15日OpenAIの日本オフィス開設が発表された。既に報道されているようにアジアとしては初の拠点、サンフランシスコ以外の拠点としては、英国のロンドン、アイルランドのダブリンに続く3か所めとなる。

OpenAI、日本語に最適化したGPT-4カスタムモデル提供。通常のGPT-4 Turboより最大三倍高速、トークン数削減でコスト効率向上
OpenAIが、日本語に最適化したGPT-4カスタムモデルの提供開始を発表しました。

ChatGPTが一時ダウン、不審なエラーメッセージ吐く。GPT-4 Turbo導入と同時期
日本時間4月11日午前2時過ぎ、OpenAIのAIチャットボット「ChatGPT」の動作がおかしくなったと、複数のユーザーがSNSに問題を報告し始めました。