GitHub

Opus 4.6に迫るコーディング性能のAI「MiniMax M2.7」がオープン化、日本語セリフが得意で商用利用OKなローカル画像生成AI「ERNIE-Image」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

Opus 4.6に迫るコーディング性能のAI「MiniMax M2.7」がオープン化、日本語セリフが得意で商用利用OKなローカル画像生成AI「ERNIE-Image」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第141回)は、家庭用PCで動く商用利用可能なBaidu開発の画像生成AI「ERNIE-Image」や、Opus 4.6に迫るコーディング性能のAIモデル「MiniMax M2.7」のオープンウェイト化を取り上げます。

AI「GrandCode」が全人類を抑えて競技プログラミングで単独1位を達成、AI自身が“次のPC”になる新概念「Neural Computers」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

AI「GrandCode」が全人類を抑えて競技プログラミングで単独1位を達成、AI自身が“次のPC”になる新概念「Neural Computers」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第140回)は、AIがPCを“操作する側”から“PC自体”になる新概念「Neural Computers」や、競技プログラミングで単独1位を達成したAI「GrandCode」を取り上げます。

「メモリは8ギガで十分ですよ」時代の到来。1ビットLLM「Bonsai 8B」を8GBのMacBook Neoで動かしてみたら爆速だった。1.1GBに8Bパラメータが入る驚きをわかってくださいよ(CloseBox) 画像
テクノロジー

「メモリは8ギガで十分ですよ」時代の到来。1ビットLLM「Bonsai 8B」を8GBのMacBook Neoで動かしてみたら爆速だった。1.1GBに8Bパラメータが入る驚きをわかってくださいよ(CloseBox)

MacBook Neoの8GB RAMでAIをなんとかするシリーズ。前回の記事では、mazzaineoにWebターミナルとSwiftLM推論エンジンを追加して、8GBメモリの限界に挑んだ話を書きました。

LTX-2.3超えの商用利用可能な日本語対応ローカル音声付き動画生成AI「daVinci-MagiHuman」、“自己改善の仕方”も自己改善するメタ認知型自己修正AI「HyperAgents」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

LTX-2.3超えの商用利用可能な日本語対応ローカル音声付き動画生成AI「daVinci-MagiHuman」、“自己改善の仕方”も自己改善するメタ認知型自己修正AI「HyperAgents」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第138回)は、動画・音声・テキストを見ているときの脳反応を予測できるMeta開発の脳活動推測AI「TRIBE v2」や、人間には簡単でもAIには難しい新しいテスト「ARC-AGI-3」を取り上げます。

8GBメモリの限界に挑戦。MacBook NeoのローカルAIにApple Siliconネイティブ推論エンジン追加したら高速化できる? ターミナルも中から使えるようにしたよ(CloseBox) 画像
テクノロジー

8GBメモリの限界に挑戦。MacBook NeoのローカルAIにApple Siliconネイティブ推論エンジン追加したら高速化できる? ターミナルも中から使えるようにしたよ(CloseBox)

MacBook Neo上で動かしているローカルエージェンティックAI「mazzaineo」に、新しい機能を2つ追加しました。1つはブラウザだけで操作を完結させるためのWebターミナル、もう1つはApple SiliconのMLXをネイティブに活用する最新の推論エンジン「SwiftLM」の統合です。

AIエージェントと人間のアイデンティティを統一管理する「Unified Access 」、1Passwordが発表 画像
テクノロジー

AIエージェントと人間のアイデンティティを統一管理する「Unified Access 」、1Passwordが発表

パスワードマネージャ「1Password」を提供している1Password社は、IDとパスワードやパスキーを用いた人間のアイデンティティだけでなく、AIエージェントが用いるシークレットなどの管理も1Passwordに統合することで、人間とAIエージェントのアイデンティティ管理を統一的に実現する新機能「Unified Access」を発表しました。

20人分の効率化。Y Combinator CEO独自開発のClaude Code用カスタムスキル「gstack」が無料公開。本業の傍ら1日1万行以上の実用的なコードを出力(生成AIクローズアップ) 画像
テクノロジー

20人分の効率化。Y Combinator CEO独自開発のClaude Code用カスタムスキル「gstack」が無料公開。本業の傍ら1日1万行以上の実用的なコードを出力(生成AIクローズアップ)

Y CombinatorのCEOであるギャリー・タン氏(Garry Tan)が、自身のClaude Codeの開発環境「gstack」をGitHubでオープンソース(MITライセンス)として無料公開したことを取り上げます。

アイデアを入力するだけで国際会議レベルの学術論文を生成する「AutoResearchClaw」、PCが使われていない時を狙ってこっそり進化するAIエージェント「MetaClaw」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

アイデアを入力するだけで国際会議レベルの学術論文を生成する「AutoResearchClaw」、PCが使われていない時を狙ってこっそり進化するAIエージェント「MetaClaw」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第137回)。

家庭用PCで使える無料OCRツール「NDLOCR-Lite」を国立国会図書館が公開、生成速度が世界最速と謳う拡散型LLM「Mercury 2」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

家庭用PCで使える無料OCRツール「NDLOCR-Lite」を国立国会図書館が公開、生成速度が世界最速と謳う拡散型LLM「Mercury 2」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第134回)は、GPT-5-miniを上回る「Qwen3.5」の軽量モデル群や、国立国会図書館が発表した家庭用PCで使える無料OCRツール「NDLOCR-Lite」を取り上げます。

gpt-oss-20bを凌駕する軽量AI「GLM-4.7-Flash」、3秒の音声からボイスクローンを生成できて商用利用可の音声AI「Qwen3-TTS」、など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

gpt-oss-20bを凌駕する軽量AI「GLM-4.7-Flash」、3秒の音声からボイスクローンを生成できて商用利用可の音声AI「Qwen3-TTS」、など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第129回)は、3秒の音声でボイスクローンを生成する多言語対応の音声合成AIモデル「Qwen3-TTS」や、2D映像から4次元(3D空間+時間)で再構築・追跡するGoogle開発AIモデル「D4RT」を取り上げます。

5秒の声から良質ボイスクローンを生成できるCPU動作の軽量ローカルAI「Pocket TTS」、AIにゲームで遊ばせたら別ジャンルでも能力が向上した研究など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

5秒の声から良質ボイスクローンを生成できるCPU動作の軽量ローカルAI「Pocket TTS」、AIにゲームで遊ばせたら別ジャンルでも能力が向上した研究など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第128回)は、5秒の音声サンプルから話者の声を模倣できるオープンソース軽量モデル「Pocket TTS」や、画像から撮影場所を特定するAI技術「Thinking with Map」を取り上げます。

家庭用GPUを使い良質な画像をわずか1秒で生成する「FLUX.2 [klein]」登場。商用利用可能モデルも(生成AIクローズアップ) 画像
テクノロジー

家庭用GPUを使い良質な画像をわずか1秒で生成する「FLUX.2 [klein]」登場。商用利用可能モデルも(生成AIクローズアップ)

今回は、Black Forest Labsが1月15日に発表した、同社史上最速の画像生成モデルファミリー「FLUX.2 [klein]」を取り上げます。kleinはドイツ語で「小さい」を意味し、コンパクトなモデルサイズと最小限のレイテンシを反映した名称です。

AI動画生成を最大200倍高速化する「TurboDiffusion」、映像で音声を分離するMeta開発のAI「SAM Audio」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

AI動画生成を最大200倍高速化する「TurboDiffusion」、映像で音声を分離するMeta開発のAI「SAM Audio」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第126回)は、画像1枚を各レイヤーに自動分解するAIモデル「Qwen-Image-Layered」や、音声を分離するMeta開発のAIモデル「SAM Audio」を取り上げます。

LLMを機能不全に追い込む新型DoS攻撃「ThinkTrap」、論文からコードを生成するAI「DeepCode」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

LLMを機能不全に追い込む新型DoS攻撃「ThinkTrap」、論文からコードを生成するAI「DeepCode」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第124回)は、API経由でクローズド大規模言語モデル(LLM)にDoS攻撃できる手法「ThinkTrap」や、論文からコードを生成するAI「DeepCode」を取り上げます。

見破れないAIの嘘は脳波が見破る、全LLMが抱える未解決問題「デジタル健忘症」をGoogleが解決か、など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

見破れないAIの嘘は脳波が見破る、全LLMが抱える未解決問題「デジタル健忘症」をGoogleが解決か、など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第123回)は、AIの嘘に表面上は騙されていても、脳波から抽出した神経信号からの判断ではその嘘を見破ることを示した研究や、画像や動画内の人や物を高精度にセグメンテーションするMeta開発モデル「SAM 3」を取り上げます。

MacBookがテルミンになる?ディスプレイ開閉角で音を変化。GitHubでソースコード公開 画像
ガジェット

MacBookがテルミンになる?ディスプレイ開閉角で音を変化。GitHubでソースコード公開

ニューヨーク在住のプロダクトデザインエンジニアのSam Henri Gold氏が、MacBookのディスプレイの開閉に合わせて音が変化するプログラムを開発、テルミンや古びたドアの音を角度に合わせて変化させる様子をXやBluesky、Mastodonなどに投稿しました。

“漢字”を正確に描画する生成AI「Qwen-Image」、5秒間の動画を4090なら21秒で生成するAI「FastWan」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

“漢字”を正確に描画する生成AI「Qwen-Image」、5秒間の動画を4090なら21秒で生成するAI「FastWan」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第108回)は、画像生成の原理で言語を生成するAIモデル「Seed Diffusion Preview」や、画像内のテキストを正確に描画する画像生成AI「Qwen-Image」を取り上げます。

オープンソース動画生成AIの新標準「FramePack」が順方向生成「F1」サポートし、叡智も即対応。もはや普段使いできますね(CloseBox) 画像
テクノロジー

オープンソース動画生成AIの新標準「FramePack」が順方向生成「F1」サポートし、叡智も即対応。もはや普段使いできますね(CloseBox)

高速でかつ長時間の動画生成が可能なオープンソースAI「FramePack」。Image to Videoで入力した画像から逆方向に生成していく仕組みですが、これを順方向。つまり、他の多くの動画生成AIと同じやり方で生成するオプション「F1」がサポートされました。

驚異のオープンソース動画生成AI「FramePack」がMacでも使える。Vidu Q1とFramePack叡智の合わせ技も試した(CloseBox) 画像
テクノロジー

驚異のオープンソース動画生成AI「FramePack」がMacでも使える。Vidu Q1とFramePack叡智の合わせ技も試した(CloseBox)

動画生成AIで、今回は3つの大きなニュースがあります。そのうち2つは前回お伝えした驚異的なオープンソース動画生成AI「FramePack」に関すること。

GitHubリポジトリを読み取り、ドキュメントを自動生成するAIツール「DeepWiki」がログイン不要、無料で使える(生成AIクローズアップ) 画像
テクノロジー

GitHubリポジトリを読み取り、ドキュメントを自動生成するAIツール「DeepWiki」がログイン不要、無料で使える(生成AIクローズアップ)

1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、GitHub上のリポジトリを自動的に解析し、ドキュメントを生成してくれるオープンソースAIツール「DeepWiki」を取り上げます。

生成AIのせいでプログラマーの仕事はなくなる? 「需要はむしろ増える」とティム・オライリー氏 画像
テクノロジー

生成AIのせいでプログラマーの仕事はなくなる? 「需要はむしろ増える」とティム・オライリー氏

オライリーメディアの創立者ティム・オライリー氏が、同社のブログに「The End of Programming as We Know It」(私たちが知っているプログラミングの終焉)という記事を公開しました。

オープンソースAI作曲ソフトがインストール出来るヤァヤァヤァ!。話題の「YuE」を自分のPCに入れて日本語ボーカル曲を生成してみた(CloseBox) 画像
テクノロジー

オープンソースAI作曲ソフトがインストール出来るヤァヤァヤァ!。話題の「YuE」を自分のPCに入れて日本語ボーカル曲を生成してみた(CloseBox)

中国開発のオープンソース謳うAI作曲ソフト「YuE」。まだ謎が多いですが、自宅のPCにインストールして楽曲を生成できたので、そのAI作曲体験をまとめました。

歌えるAI作曲ソフトにオープンソースの波。SunoとUdioのライバル「YuE」は日本語楽曲にも対応(CloseBox) 画像
テクノロジー

歌えるAI作曲ソフトにオープンソースの波。SunoとUdioのライバル「YuE」は日本語楽曲にも対応(CloseBox)

オープンソース版でSuno並に品質が高くて歌もうたえるAI作曲ソフト「Yue」をMultimodal Art Projectionと香港科技大学(HKUST)が共同開発しました。

GitHubで最も使われている言語、PythonがJavaScriptを抜き1位に。生成AI関連プロジェクト急増が要因 画像
テクノロジー

GitHubで最も使われている言語、PythonがJavaScriptを抜き1位に。生成AI関連プロジェクト急増が要因

GitHubは、この1年のGitHubにおけるGitHubの利用動向やオープンソースの動向などをまとめた年次レポート「Octoverse 2024」を発表しました。

GitHub、プロンプトだけでアプリ生成できる「GitHub Spark」テクニカルプレビュー公開。スマホにも対応 画像
テクノロジー

GitHub、プロンプトだけでアプリ生成できる「GitHub Spark」テクニカルプレビュー公開。スマホにも対応

GitHubは、日本時間10月30日未明に開幕したイベント「GitHub Universe'24」で、自然言語による指示だけで、パーソナライズされた小規模なアプリケーション(Micro-App)をすぐに生成できる「GitHub Spark」の テクニカルプレビューを発表しました 。

AI動画生成もローカルマシンで動かす時代に。Image to Video含め生成し放題のCogVideoを一発インストールできるPinokioという選択肢(CloseBox) 画像
テクノロジー

AI動画生成もローカルマシンで動かす時代に。Image to Video含め生成し放題のCogVideoを一発インストールできるPinokioという選択肢(CloseBox)

話題のオープンソース動画生成AI「CogVideo」をローカルマシンに超簡単インストールできたのです。

他人の顔でYouTuber? 写真内の顔を思うように動かして話をさせるAI「LivePortrait」を動画生成AI「KLING」開発元が発表など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

他人の顔でYouTuber? 写真内の顔を思うように動かして話をさせるAI「LivePortrait」を動画生成AI「KLING」開発元が発表など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第54回)では、KLINGを開発した快手が、画像内のキャラクターの顔を自在に動かす技術「LivePortrait」を発表しました。

ChatGPT Artifactsができた? GPT-4oでもClaudeみたいな楽しいプロンプト開発ができるのだ(CloseBox) 画像
テクノロジー

ChatGPT Artifactsができた? GPT-4oでもClaudeみたいな楽しいプロンプト開発ができるのだ(CloseBox)

大規模言語モデルのClaudeが送り出した新機能、Artifactsを使った記事が思いのほか好評のようですが、問題が一つ。使用量制限がかかってしまい、次のアクションまで数時間待たされることが頻発しているのです。

アトラシアン、新AIサービス「Atlassian Rovo」発表。Googleドライブ、GitHub、Slack、Teamsなどを横断してAIが学習、ユーザーを支援 画像
テクノロジー

アトラシアン、新AIサービス「Atlassian Rovo」発表。Googleドライブ、GitHub、Slack、Teamsなどを横断してAIが学習、ユーザーを支援

アトラシアン、新AIサービス「Atlassian Rovo」発表。GoogleドライブやGitHub、Slack、Teamsなど同社内外のサービスを横断してAIが学習、ユーザーを支援

任天堂、Switchエミュ『Yuzu』関連GitHubリポジトリ8000超に削除通告 画像
ゲーム

任天堂、Switchエミュ『Yuzu』関連GitHubリポジトリ8000超に削除通告

任天堂は、8535ものGitHubリポジトリーに対するDMCA削除通知を送付しました。

コードの脆弱性をAIが自動で発見、解説と修正提案する機能をGitHubが発表。JavaScript、TypeScript、Java、Python対応 画像
テクノロジー

コードの脆弱性をAIが自動で発見、解説と修正提案する機能をGitHubが発表。JavaScript、TypeScript、Java、Python対応

GitHubは、脆弱性のあるコードをAIボットが自動的に発見、修正したコードとその解説をプルリクエストしてくれる「code scanning autofix」(コードスキャン自動修正機能)を発表しました。

AIがコーディングしてくれる「Amazon CodeWhisperer」正式投入。GitHub Copilotに対抗、個人利用は無料 画像
テクノロジー

AIがコーディングしてくれる「Amazon CodeWhisperer」正式投入。GitHub Copilotに対抗、個人利用は無料

アマゾンが、GitHubのAIコーディング支援サービスGitHub Copilotに対抗する動き。

マイクロソフト、GTP-4ベースのGitHub Copilot XをVisual Studioに搭載したデモ動画公開。AIが問題を指摘し修正、テストコードの生成も 画像
テクノロジー

マイクロソフト、GTP-4ベースのGitHub Copilot XをVisual Studioに搭載したデモ動画公開。AIが問題を指摘し修正、テストコードの生成も

マイクロソフトは、Visual StudioでGTP-4ベースの「GitHub Copilot X」を用い、プログラミングを行うデモ動画「GitHub Copilot X in Visual Studio」を公開しました。

Twitterのソースコードの一部がGitHubに流出、裁判所への提出書類で明らかに 画像
テクノロジー

Twitterのソースコードの一部がGitHubに流出、裁判所への提出書類で明らかに

3月24日、Twitterは「FreeSpeechEnthusiast」と自称するGitHubユーザーがTwitterのソースコードの一部を許可なく共有したとして、このコードの削除をGitHubに求め、カリフォルニア州北部連邦地方裁判所に著作権侵害であるとして、このユーザーを召喚する請求を出しました。

ChatGTP-4ベースの「GitHub Copilot X」発表。AIにバグの調査依頼と修正案を指示、ドキュメントを学習し回答も 画像
テクノロジー

ChatGTP-4ベースの「GitHub Copilot X」発表。AIにバグの調査依頼と修正案を指示、ドキュメントを学習し回答も

GitHubは、ChatGTP-4をベースで「GitHub Copilot」の機能を大幅に強化した「GitHub Copilot X」を発表しました。

GitHubユーザーが1億人に到達。約16年でソースコード管理の事実上標準に 画像
テクノロジー

GitHubユーザーが1億人に到達。約16年でソースコード管理の事実上標準に

GitHubは1月25日付けでユーザーが1億人に到達したことを発表しました。

いずれプログラムの80%がAIで作成されるようになる。GitHubのCEOが予言 画像
テクノロジー

いずれプログラムの80%がAIで作成されるようになる。GitHubのCEOが予言

GitHubによると、現在はコードの約40%がGitHub Copilotで書かれているそうです。

「Hey, GitHub! 」でコーディングして実行。GitHubが音声制御機能をプレビュー公開 画像
テクノロジー

「Hey, GitHub! 」でコーディングして実行。GitHubが音声制御機能をプレビュー公開

GitHubは、音声によるGitHubの操作やコーディングを可能にする実験的機能をプレビュー公開しました。

  • 38件中 1 - 38 件を表示