今回は、AIを用いて死海文書の筆跡を分析した論文「Dating ancient manuscripts using radiocarbon and AI-based writing style analysis」を取り上げます。
ChatGPTが歌えるようになりました。
Amazon MGMスタジオは2023年に起こった、OpenAIの協働創業者サム・アルトマンCEOが突如解任され、5日後に復帰した一連の騒動を映画化すべく準備を進めている模様です。
AI作曲では楽曲が完成した状態で生成されます。このため、ボーカル、ギター、シンセサイザー、ドラム、ベースといったパート別の編集は基本的にAIベースのSTEM分離機能を使うことになります。
今回は、社会経済的地位の違いでAIの利用方法がどう異なるのかの「AIギャップ」を調査した研究「The AI Gap: How Socioeconomic Status Affects Language Technology Interactions」を取り上げます。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第97回)では、Tiktokの開発元として有名な中国企業「ByteDance」が発表した4つのAI技術を取り上げます。
Anthropicは、生成AIチャットボットClaudeを「完全な音声会話」で利用できる「音声モード」を、今後数週間のうちにiOSおよびAndroidアプリに提供することを明らかにしました。
HUAWEIは5月27日、スマートウォッチの最新モデル「HUAWEI WATCH FIT 4 Pro」を発表しました。価格はフルオロエラストマーベルト(ブラック、ブルー)が3万7180円、撥水ナイロンベルト(グリーン)が3万9380円。ベルト単体での販売も予定されています。
5月20日のリアルイベント、テクノエッジ「生成AI最前線」の講演者本人自身の詳細レポート
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、脳に電極を埋め込まないで脳活動から直接文章を文字に起こす非侵襲AI技術を提案した、オックスフォード大学の研究者らによる論文「Unlocking Non-Invasive Brain-to-Text」を取り上げます。
Anthropicは5月22日に初めての開発者向けイベントを開催し、新しいAIモデル Claude の最新AIモデル「Claude Opus 4」「Claude Sonnet 4 」を発表しました。
テクノエッジでは2025年5月20日、東京都内にて、テクノエッジ主催のイベント「生成AI最前線:生成AI最新動向解説イベント」を開催しました。
Googleは今週、米国で新たに「AIモード」の提供を開始すると発表しました。
歩いてピクミンを集め育てるゲーム Pikmin Bloom が、AI食事管理アプリ『あすけん』とのコラボイベントを開始しました。
OpenAIは5月22日、Appleの最高デザイン責任者だったジョニー・アイヴ率いるAIスタートアップ企業「io」を買収したと発表しました。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第96回)では、参照音声だけで音声合成を生成できるTTSモデル「MiniMax-Speech」、自らアルゴリズムを発見して進化させ続けるAI「AlphaEvolve」を取り上げます。
PixelやGalaxyのレコーダー機能やiPhoneのボイスメモ、PLAUDなどのAI音声レコーダーなど録音・文字起こしのソリューションがどんどん増えてきています。
今回は、大規模言語モデル(LLM)を活用して日本の国会議員のこれまでの発言を分析して政治的立場をまとめた研究「KOKKAI DOC: An LLM-driven framework for scaling parliamentary representatives」を取り上げます。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第95回)では、“検索しない”AI検索エンジン「ZeroSearch」や、AI自身が学習効率の良いタスクを生成し自分で解くことで学習する外部データ不要のAIシステム「Absolute Zero」を取り上げます。
リファレンス画像を使用するComfyUI Workflowとは!?
Alibaba CloudとMeltingHackが開催したゲーム開発ハッカソン、Tokyo Game Jam 2025 Spring のイベントリポートをお届けします。
東京証券取引所のスタンダード市場に上場しているインプレスホールディングスは5月13日、上場廃止を予定していることを発表しました。
日本時間5月13日午前2時よりYouTubeのAndroidチャンネルで配信したThe Android Show I/O Editionにて、GoogleはAndroid 16に関する新情報をいくつか発表しました。
今回は、チャットボットAIの精度が日進月歩で向上している一方で悪化している「幻覚」(ハルシネーション)の現状についてを取り上げたいと思います。
エルトン・ジョン、デュア・リパ、ポール・マッカートニー、イアン・マッケランといった、英国の著名なミュージシャンやアーティスト、作家など400人以上が署名した「AIからの著作権保護」を訴える公開書簡がキア・スターマー首相宛てに送付されました。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第94回)では、1ビットLLMの進化版「BitNet v2」と、AIに何度も自己議論させることで精度が向上していく手法「CoRT 」を取り上げます。
YuEやDiffRhythmなど、オープンソース版も充実してきた楽曲生成AIですが、また中国から新しいソフトが公開されました。「ACE-Step」は、英語、日本語を含む19言語の歌詞に対応し、Lyrics to Musicの生成が可能。
Google のスマートフォン Pixel 9a を「AIスマホ」として試してみました。
今回は、現在AIモデル評価の業界標準とされているランキング形式(リーダーボード)のAIベンチマーク「Chatbot Arena」における問題を明らかにした研究「The Leaderboard Illusion」を取り上げます。
高速でかつ長時間の動画生成が可能なオープンソースAI「FramePack」。Image to Videoで入力した画像から逆方向に生成していく仕組みですが、これを順方向。つまり、他の多くの動画生成AIと同じやり方で生成するオプション「F1」がサポートされました。
AI作曲サービスのSunoがひさびさの(2024年11月20日以来)メジャーバージョンアップを果たし、最新版はv4.5となりました。一度で生成できる楽曲の長さはなんと8分となります。そのほかにも改善点・新機能が多数。
最近のChatGPTが過度にユーザーを褒め称えたり、回答の正しさよりも迎合を優先すると批判が高まっていた件について。
HiDream-I1-FullとDevの違いは!?
OpenAIは、ChatGPTが18歳未満の未成年ユーザーとのチャットで性的に露骨な画像を生成したり、NFSWな会話を展開するのを制限するための修正を「積極的に行っている」と述べています。
Google NotebookLMには、PDF、テキスト、YouTubeなどを読み込んで、その内容についてリアルな対話ポッドキャスト解説を生成する機能があります。2024年9月11日にローンチした時点では英語でしか使えなかったのですが、4月30日、ついに日本語対応しました。
AI企業OpenAIのCEOであるサム・アルトマン氏は、生成AIチャットボットサービス ChatGPTの標準モデルであるGPT-4oが「媚びへつらいすぎて気に障る(良い部分もあるが)」と述べ、早急に性格を修正する予定であることを明らかにしました。
動画生成AIで、今回は3つの大きなニュースがあります。そのうち2つは前回お伝えした驚異的なオープンソース動画生成AI「FramePack」に関すること。
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、GitHub上のリポジトリを自動的に解析し、ドキュメントを生成してくれるオープンソースAIツール「DeepWiki」を取り上げます。
「NVIDIA Gamer Day」の模様をお伝えしていきます!
韓国のスタートアップ「Newnal」が開発中のAIスマートフォンは、個人データを活用したアシスタント機能を備え、プライバシー保護にも配慮されている。2025年5月に発売予定。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第92回)では、ByteDanceが発表した2つのモデル、動画生成AI「Seaweed-7B」とGPT-4o超えという画像生成AI「Seedream 3.0」を取り上げます。
ロンドンで開催中のイベント Adobe MAX London 2025で、アドビがクリエイティブAIソリューション Firefly の最新アップデートを披露しました。