香港科技大学などが開発したオープンソースのAI作曲ソフト「YuE」が発表されて数日経ちました。筆者はWindowsでのインストールができずにWSL2のLinux環境で実行できるようになりましたが、いまだに一定のスキルは必要なようです。
ASUSが軽量のARM Windows 11ノート『ASUS Zenbook SORA』UX3407シリーズを発表しました。
40年前の掛け時計の修理を引き受けたものの、故障の原因はICの故障と判明。時計キットのムーブメントから基板の移植を試みるが……。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第81回)では、DeepSeekの画像生成AI「Janus-Pro」と、Sakana AIによるLLMの知識を小規模モデルに転移させる蒸留法「TAID」を取り上げます。
OpenAIがChatGPTの新機能としてdeep researchを投入しました。筆者が常日頃考えているテーマを深掘り検索してもらいました。同様の機能はGoogle Geminiもあるのでそちらにも同じ質問を投げました。
先週の土曜日早朝、AI研究家の清水亮さんが興奮して「o3-miniすごい」「自分だけではそのポテンシャルを実感できないからハッカソンやろう」と言ってるのに居合わせ、自分もそのハッカソンに出ることになりました。
今回は、OpenAIが1月31日(現地時間)に発表した「o3-mini」を取り上げます。
サンフランシスコベースのスタートアップ がAI作曲サービス「Riffusion」のパブリックベータを公開しました。
Sunnoの新しい歌詞エディタの出来がすごく良いので紹介します。
ImageFXなど外部サービスの生成AI画像の出来は!?
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第80回)では、1枚の画像やテキストから高解像度のテクスチャ付き3Dアセットを生成するAIモデル「Hunyuan3D 2.0」や、ByteDanceのブラウザを自動操作するAIエージェント「UI-TARS」を取り上げます。
OpenAIは、中国DeepSeekが同社のAIモデルを強化するために、OpenAIのデータを「抽出(Distrill)」した証拠を掴んだと主張しています。
中国開発のオープンソース謳うAI作曲ソフト「YuE」。まだ謎が多いですが、自宅のPCにインストールして楽曲を生成できたので、そのAI作曲体験をまとめました。
オープンソース版でSuno並に品質が高くて歌もうたえるAI作曲ソフト「Yue」をMultimodal Art Projectionと香港科技大学(HKUST)が共同開発しました。
トランプ大統領就任式ではGoogleのピチャイCEOや創業者のサーゲイ・ブリンさんの顔も見えましたが、今のところはGoogleがトランプ政権に協力する具体的な発表はないようです。
CES 2025におけるNVIDIAブースは、「GeForce RTX 50シリーズを発表したばかり」ということもあり、会場は、なかなかの盛況ぶりであったように思う。
今回は、日本語でリアルタイムに音声対話してくれるAIモデル「J-Moshi」に注目します。名古屋大学の研究者らが開発したこのAIモデルは、ユーザーの声を聞いて内容に応じた発話を同時に行います。
『ゲーム・オブ・スローンズ』の原作者として知られるファンタジー・SF小説家のジョージ・R・R・マーティンは最近、その作品リストに査読済みの物理学論文を加えました。
米国のChatGPT Proユーザーのみに開放されているOpenAIのAIエージェント「Operator」を試してみました。
OpenAIは1月23日(米国時間)、ユーザーの代わりにブラウザを操作してタスクを実行するAIエージェント「Operator」を発表しました。
サムスンがGalaxy初のスマートリング製品 Galaxy Ring の日本向け販売を発表しました。
開催中の Galaxy Unpacked イベントで、サムスンがスマートフォンのフラッグシップモデル Galaxy S25シリーズを発表しました。
いや~、発表されてしまいましたねぇ。これは、個人的な話です。
人気のショート動画SNS「TikTok」は、今後米国でサービスを継続するには米国企業に買収されるか、少なくとも米国に50%を譲渡して「合弁事業」になる必要があるとされています。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第79回)では、自分の動きに応じてキャラクターの顔をリアルタイムに動かせる動画生成AI「RAIN」、400万トークンを処理できる大規模言語モデル「MiniMax-01」を取り上げます。
「倍密度マイクロフロッピーディスク」は、1983年頃から登場した3.5インチの磁気ディスク。容量は250KB~1MB。2DD、1DD、2D、1Dなどのさまざまな規格が存在する。
テクノエッジ編集部では1月16日、米国ラスベガスで開催された家電&IT見本市「CES 2025」の報告会を兼ねたテクノエッジ新年会を開催しました。
人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる?」の著者である西川和久さんを講師に迎えた、生成AIグラビアワークショップの第3期第3回を1月22日に開催いたします。
世界初のAIチャットボット「ELIZA」(イライザ)を60年ぶりに復活させた研究「ELIZA Reanimated: The world’s first chatbot restored on the world’s first time sharing system」
テック系メディアとn max nがコラボした、高級カーフレザーのApple Watchバンドが登場。独自製法で堅牢性を高め、珍しいカラーリングが魅力。おすすめの逸品です。
生成AI画像で一番気になるのは生成時間。SD 1.5/SDXLはRTX 30系/40系を使えば比較的速いものの、FLUX.1 [dev] になって随分時間がかかるようになってしまった。が、LoRAを使って高速化する技術がある。筆者お気に入りであるFLUX.1-Turbo-Alpha を紹介しよう。
毎月13万円をかけている生成AIサブスクですが、特に動画方面で、ちょこちょことアップデートがされています。今回はその辺で気になるところを試してみます。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第78回)では、自律AIたちが研究プロセス全般を自動で実行するモデル「Agent Laboratory」、ロボットや自動運転車などの物理AI向けデジタル環境学習プラットフォーム「Cosmos」を取り上げます。
今回は、AIがフリーランス(オンライン)の各仕事にどのような影響を及ぼし、職種による違いを分析した論文「AI and Freelancers: Has the Inflection Point Arrived?」に注目します。
OpenAIは、ChatGPTの音声コマンドを利用して動作する電動セントリーガン(全自動回転砲塔)を開発する様子をSNSに投稿していたユーザーのAPIアクセスを遮断したと発表しました。
米アリゾナ州スコッツデールのある駐車場で、Waymoの自動運転タクシーが駐車場をぐるぐると回り始め、乗客が危うく飛行機に乗り遅れそうになる問題が発生しました。
いつでもどこでも文章執筆が可能なスマートタイプライターを主な製品とするAstrohausが、文章執筆に特化した有線 / ワイヤレス88キーメカニカルキーボード「Freewrite Wordrunner」をCES 2025で発表しました。
また欲しいものが出てしまいました。Mac miniっぽいスーパーコンピュータ。
ラスベガスで開催中のCES 2025基調講演で、NVIDIAのジェンスン・フアンCEOが次世代GPU GeForce RTX 50シリーズを正式に発表しました。
サムスンは、2025年最初のGalaxy Unpackedイベントを1月22日(日本時間23日午前3時)より開催すると発表しました。
2025年1月6日朝に見た夢の続きをChatGPT o1 pro modeに短編スタイルで書いてもらいました。
オンラインサービスのログイン画面などでユーザーがボットでないことを確認するCAPTCHAに、1993年のFPSゲーム『Doom』が組み込まれました。自分が生身の人間だと証明するには、ゲームをプレイして「敵を3体倒す」必要があります。