[go: up one dir, main page]

GPTに関するdokoのブックマーク (463)

  • これはもう実質AGIでは? AIが勝手にブラウザを操作していろいろやってくれちゃう BrowserUseが爆誕|shi3z

    今日もいつものようにシラスでデイリーAIニュースを配信していると、とんでもないものにでくわした。 もうタイトルに書いてあるけど、AIが勝手にブラウザを操作して色々やってくれてしまう、その名もBrowserUseだ。 インストールは超簡単。 macなら以下の二行だけだ。 $ pip install browser-use $ playwright install使うのも超簡単だが、コマンドラインに落ちるのが怖い人々には簡単に見えないかもしれない。環境変数のOPENAI_API_KEYとかにAPIキーを入れておくこと。 $ python >>> from langchain_openai import ChatOpenAI >>> from browser_use import Agent INFO [browser_use] BrowserUse logging setup complete

    これはもう実質AGIでは? AIが勝手にブラウザを操作していろいろやってくれちゃう BrowserUseが爆誕|shi3z
  • OpenAI のAIリリース年表|npaka

    7月17日 Code Interpreter7月19日 Meta が Llama 2 公開 7月20日 Custom Instructions

    OpenAI のAIリリース年表|npaka
    doko
    doko 2024/12/23
    ほんとたすかる
  • 2024年生成AIの進歩まとめ

    こんにちは!逆瀬川 ( https://x.com/gyakuse ) です! 生成AI Advent Calendar 2024の記事を書くの忘れていたので、現時点での生成等AIの進歩をまとめてみました!今日はAIがいまなにできんの?ってこと聞かれたときにこれできるよ!って教えるためのメモとして活用してください!また、生成AIプロダクト Advent Calendar 2024というのもソロでやっています。このカレンダーではLLMの基礎理論からModelのFine-Tuning、プロダクト開発等をまとめています。ぜひこちらも見てください! 未来を感じる技術の進歩 動画生成では、Veo2 や Sora が登場しました。 インタラクティブな動画生成では、Genie2 (WASDと方向キーで操作可能な世界モデル)が非常に革新的な進歩を遂げています (振り返っても一貫性を保つ長期性が当にすごい

    2024年生成AIの進歩まとめ
    doko
    doko 2024/12/23
    ほんとたすかる
  • ChatGPT Pro、Sora、Projects、o3 「12 Days of OpenAI」発表まとめ

    ChatGPT Pro、Sora、Projects、o3 「12 Days of OpenAI」発表まとめ
  • 否定文を理解できないAIたち - ジョイジョイジョイ

    BERT や GPT の登場により、テキストを扱うモデルは大きく発展しましたが、否定というごくありふれた操作を扱うのが依然難しいです。 稿では、その理由と、部分的な解決策を紹介します。 目次 目次 否定文を理解できないAIたち 否定文を理解できずに困ること なぜ否定文をうまく扱えないのか なぜたまに成功するのか 対処法 ファインチューニング プロンプトの工夫 否定文を意識した訓練 文書数を増やす クエリとキーを拡張する おわりに 否定文を理解できないAIたち BERT (tohoku-nlp/bert-base-japanese-v3) で A =「私はお寿司が好きです。」 B =「私の好きなべ物はお寿司です。」 のテキスト埋め込みのコサイン類似度を求めてみましょう。A と B は同じようなことを言っており、予想されるようにコサイン類似度は 0.9695 と高いです。 では、 A =「

    否定文を理解できないAIたち - ジョイジョイジョイ
    doko
    doko 2024/12/18
    こういうのほんとよく見つけてくるなぁ
  • OpenAIのプロンプトジェネレーターで至高のプロンプトを生成する - Taste of Tech Topics

    こんにちはイワツカです。 欲の秋ということでサツマイモやキノコが美味しい季節ですね。 さて今回は、生成AIを使おうと思ってもプロンプトの書き方がよく分からず、生成AIから思ったような回答を得られない...なんて方におススメのOpenAIのプロンプトジェネレーター機能を紹介します。 1. プロンプトジェネレーターとは 使い方 2. ユースケースごとのプロンプトと結果比較 Pythonコードのリファクタリング プロンプトジェネレーターを使わない場合 プロンプトジェネレーターを使う場合 API設計 プロンプトジェネレーターを使わない場合 プロンプトジェネレーターを使う場合 ブログ作成 プロンプトジェネレーターを使わない場合 プロンプトジェネレーターを使う場合 3. まとめ 1. プロンプトジェネレーターとは プロンプトジェネレーターとは、その名の通り、AIに対する指示文(プロンプト)を自動的に

    OpenAIのプロンプトジェネレーターで至高のプロンプトを生成する - Taste of Tech Topics
    doko
    doko 2024/11/19
  • RAGが「複雑な質問に弱い問題」を解決する「Plan×RAG」

    記事では、RAGの性能を高めるための「Plan×RAG」という手法について、ざっくり理解します。株式会社ナレッジセンスは、エンタープライズ企業向けにRAGを提供しているスタートアップです。 この記事は何 この記事は、RAGの文脈消える問題を克服する新手法「Plan×RAG」の論文[1]について、日語で簡単にまとめたものです。 今回も「そもそもRAGとは?」については、知っている前提で進みます。確認する場合はこちらの記事もご参考下さい。 題 ざっくりサマリー Plan×RAGは、RAGの精度を上げるための新しい手法です。アールト大学とMicrosoft Researchの研究者らによって2024年10月に提案されました。 ざっくり言うと、Plan×RAGとは、「計画を立ててから検索する」手法です。Plan×RAGでは、ユーザーの質問を、まず最初に小さな単位に分解。その後、それらの関係性

    RAGが「複雑な質問に弱い問題」を解決する「Plan×RAG」
    doko
    doko 2024/11/13
  • 反AIの人、生成AIに関して 学習する 生成する という2段階を想定しているように見えることが多い。現行法やAI推進者の多くは文科省の出している資料などを見るに 学習する 生成する 公表する という3段階を想定している。ここが一番違うところだなあと思っている。

    AIの人、生成AIに関して 学習する 生成するという2段階を想定しているように見えることが多い。 現行法やAI推進者の多くは文科省の出している資料などを見るに 学習する 生成する公表するという3段階を想定している。ここが一番違うところだなあと思っている。 反AIの人は 学習をする(けしからん) 生成をする(けしからん)で話が完結してしまう。 AI派は 学習をする(おおむね白になるように法的整備が済んでる) 生成をする(おおむね白になるように法的整備が済んでる)公表をする(原則的に著作権はここでなにかしらの判定を行う)なので、雑な人は「学習生成は真っ白だろ」というし、慎重な人は「(3段階目がどうなっているかが前の段階に波及するので)ケースバイケースですね」とか「白寄りのグレーってとこです」って言う。 ここで問題になるのは学習元のコンテンツを享受する目的だとダメっていうのが反AIにとっては難

    反AIの人、生成AIに関して 学習する 生成する という2段階を想定しているように見えることが多い。現行法やAI推進者の多くは文科省の出している資料などを見るに 学習する 生成する 公表する という3段階を想定している。ここが一番違うところだなあと思っている。
  • ほぼリアルタイム!?爆速で動作する日本語特化の文字起こしAI!『kotoba-whisper-v2.0』 - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? みなさんこんにちは!私は株式会社ulusageの、技術ブログ生成AIです!これからなるべく鮮度の高い情報や、ためになるようなTipsを展開していきます。よろしくお願いします!(AIによる自動記事生成を行なっています。システムフローについてなど、この仕組みに興味があれば、要望が一定あり次第、別途記事を書きます!) 爆速で動作する日語特化の文字起こしAI『kotoba-whisper-v2.0』を試してみた はじめに ビジネスシーンや日常生活で、音声データを文字起こしするニーズはますます高まっています。議事録の作成やインタビューの文字起こ

    ほぼリアルタイム!?爆速で動作する日本語特化の文字起こしAI!『kotoba-whisper-v2.0』 - Qiita
    doko
    doko 2024/11/04
  • 【教材まとめ】これ全部やったら流石に誰でもつよつよAIエンジニアになれる - Qiita

    はじめに 記事ではAI知識ゼロから始めてAIエンジニアとして実務にチャレンジできるレベルを目指してロードマップ形式でコンテンツをまとめました。 生成AIの台頭、SakanaAIの大型資金調達やGoogleの研究者(ヒントン氏ら)のノーベル賞受賞も重なり、さらにAIへの注目が集まっている状態かと思います。 しかし初学者にとって、AIを学ぶハードルはまだまだ高いのが現状です。AIをツールとして活用するだけなら比較的障壁は高くないですが、理論的な部分まで含めると学ぶべき内容が広く、分野によっては難易度が高く、せっかく学び始めたのに挫折する人も多いです。 未経験だけどAIの知識を身につけたい 現在web開発の知識があり、AIも学びたい AIを学んで転職副業でバリバリ活躍したい といった方は是非読み進めていってください。 コンテンツは随時追記していきます。 構成 記事は下記のような構成でコンテ

    【教材まとめ】これ全部やったら流石に誰でもつよつよAIエンジニアになれる - Qiita
    doko
    doko 2024/10/30
  • ノーコード&AIカオスマップ更新【2024年10月版】

    ノーコードAIカオスマップ更新【2024年10月版】<2年ぶり更新>ノーコードカオスマップを更新 + AIカオスマップを追加【一般社団法人NoCoders Japan協会】 一般社団法人NoCoders Japan協会は、『ノーコードカオスマップ(2024年版)』の2年ぶりの更新に加え、新たに『生成AIカオスマップ(2024年版)』を公開いたします。これにより、ノーコードと生成AIの分野の急速に進化するサービスの全体像を一目で把握できるようになります。 【目的と背景】 当協会は2020年に設立され、「全ての人々が自分たちの身近な課題をノーコードで解決する社会をめざす」をキーワードにノーコードの普及活動を行っております。 HP:https://no-coders-japan.org/ 昨今、「生成AI」がノーコードの進化を後押しする流れとなっています。設立当初に比べ、圧倒的に優れたUXを提

    ノーコード&AIカオスマップ更新【2024年10月版】
  • AI、ついにパソコンを使えるようになってしまう Anthropic「Claude 3.5 Sonnet」新機能

    AI企業のAnthropicは10月23日、大規模言語モデル「Claude 3.5 Sonnet」の刷新と、新モデル「Claude 3.5 Haiku」の導入を発表した。Claude 3.5 Sonnetには、AIモデルが人間のようにコンピューターを操作できるようになる新機能「コンピューター使用」が追加された。 アップデート版のClaude 3.5 Sonnetは、特にコーディング分野で大きく性能を伸ばし、業界ベンチマークで広範囲にわたる改善を示した。SWE-benchの検証済みタスクでは、前バージョンの33.4%から49.0%へと性能が向上し、他のすべての公開モデルを上回る結果となった。 新たに導入されるClaude 3.5 Haikuは、前世代の最大モデルであるClaude 3 Opusと同等の性能を持ちながら、コストと速度は前世代のHaikuと同等を維持している。特にコーディングタス

    AI、ついにパソコンを使えるようになってしまう Anthropic「Claude 3.5 Sonnet」新機能
    doko
    doko 2024/10/23
  • OpenAI o1の開発者がo1の仕組みなどについて語るインタビュー(日本語訳と感想)|IT navi

    ソーニャ・ホアン: 日はノーム、ハンター、イルゲをお迎えしました。3人はOpenAIプロジェクト・ストロベリー、別名o1の研究者です。o1はOpenAIが初めて格的に取り組んだ汎用推論時計算で、推論、思考連鎖、推論時スケーリング則などについてチームと話し合うのを楽しみにしています。 o1への確信ソーニャ・ホアン: イルゲ、ハンター、ノーム、お越しいただきありがとうございます。そしてo1の公開おめでとうございます。まず伺いたいのですが、これがうまくいくという確信は最初からありましたか? ノーム・ブラウン: この方向性に何か有望なものがあるという確信はあったと思いますが、実際にここに至る道筋は決して明確ではありませんでした。o1を見てみると、これは一夜にしてできたものではありません。実際、何年もの研究が投入されており、その研究の多くは実際には実を結びませんでした。しかし、OpenAIとリ

    OpenAI o1の開発者がo1の仕組みなどについて語るインタビュー(日本語訳と感想)|IT navi
    doko
    doko 2024/10/22
  • サクッと始めるRAG開発【LangChain / Python】

    このでは、初心者・入門者の方に向けて、RAGの知識や使い方を体系的にまとめました。少し難易度の高い内容になりますが、書の中で事前に学んでおくべき項目を示しているため、ご安心ください。 【概要】 ・内容:RAGの概要【入門者向けの基礎知識】、RAGの処理フロー【In-Context Learning / Embedding / Vector Search】、RAGのビジネス活用ロードマップ【大企業向け】、RAGの実装アプローチ、RAGの大分類【Document RAG】、RAGの大分類【SQL RAG】、RAGの大分類【Graph RAG】、RAGの精度評価アプローチ、RAGの精度評価方法【LangChain Evaluation】、RAGの精度評価方法【Ragas】、RAGの精度改善手法【データ品質 / プロンプト品質 / ベクトル検索】、RAGの精度改善のためのLLMOps概論、LL

    サクッと始めるRAG開発【LangChain / Python】
  • 生成AIにTOEIC®リスニング問題を無限に生成してもらい、スコア900超え達成した話 - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに 今年の夏はTOEICスコア900超えを一つの目標にしていて、そのためにはリスニングが課題でした。 とにかく数をこなそうと、無料で問題を解けるアプリを探して、初めはそれをずっとやっていましたが、一日に解ける問題数が限られていて、徐々に物足りなくなってきました。 前々からTOEICの問題ってAIで生成できるんじゃね?と思っていたので、この際スコア900越えに加えて、AIでリスニング問題生成&Webサービス化を目標にし、ようやく完成したので公開しました。 公開したリスニング問題AI生成サイト ※AIで生成し、内容のチェックは行ってい

    生成AIにTOEIC®リスニング問題を無限に生成してもらい、スコア900超え達成した話 - Qiita
    doko
    doko 2024/10/09
  • GraphRAGを使った生成AIチャットアプリを作ってみた - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? RAGの精度向上に有効な施策としてGraphRAGという手法があります。 インプットされた文章をノードとエッジと呼ばれる要素に分解し、ノード間の関係性をグラフデータとして表現する手法になります。 例えば文章中に出てくる人物をノードとし、人物間の関係性をエッジで表現する、といったイメージです。 ベクトル検索を使ったRAGの場合「ドキュメント内の離れた箇所に登場するけれども、関係性の強い情報」といったものを扱う際に課題がありました。 GraphRAGの活用により、そういった情報を関連のある情報として拾えるようになり、生成AIによる文脈理解の

    GraphRAGを使った生成AIチャットアプリを作ってみた - Qiita
    doko
    doko 2024/10/07
  • OpenAIのプロンプト自動作成機能を触ってみる - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? OpenAI DevDay 2024でいくつかの新しい機能が実装されています。 新機能のひとつに、プロンプト自動作成というものがあります。 目的を入力しただけで、自動的にシステムプロンプトを作成してくれるというものです。 他の新機能に比べると、やや地味目ですが、どんな感じのプロンプトを作成してくれるのか気になったので試してみました。 TL;DR 曖昧な一文からでも、マークダウン形式に沿ったプロンプトを書いてくれるので、たたき台としてよさそう。 プロンプト自体がマークダウン形式なせいか、Output形式がマークダウンに引きずられることがあ

    OpenAIのプロンプト自動作成機能を触ってみる - Qiita
    doko
    doko 2024/10/06
  • RAGに関する主要な論文を時系列順にまとめていく(2024年度版)|R

    RAGに関する主要な論文まとめていきます。(過去の分含めて随時更新予定) 見つけたものからまとめているので、最新の2024年以降の論文多めです。 Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks(22/05/2022) 一言紹介❓ LLMって、事前学習された知識に関しては答えてくれるけど、最新のニュースだったり、専門的な情報や組織固有の情報には対応できないよなぁ 💡 外部知識をLLMに検索させよう!→RAGの誕生 Abstract日語訳大規模な事前学習済み言語モデルは、そのパラメータに事実知識を蓄積し、下流の自然言語処理(NLP)タスクに微調整されたときに最先端の成果を達成することが示されています。しかし、知識をアクセスして正確に操作する能力は依然として限られており、知識集約型タスクでは、タスク固有のアーキ

    RAGに関する主要な論文を時系列順にまとめていく(2024年度版)|R
    doko
    doko 2024/09/29
  • LLMの効率化を支えるアルゴリズム

    2024.09.04

    LLMの効率化を支えるアルゴリズム
    doko
    doko 2024/09/25
  • コード×AI | 技術評論社

    概要 GitHub CopilotやChatGPTなど生成AIによるコード生成やコードリーデイング支援が流行っています。これらは破壊的なイノベーションで、いずれはすべての開発者や企業が導入するものです。 ただ、現状では生成AI×コードを推進・導入している企業は多くはなく、さらに活用法については手探りの状況です。 書では生成AI×コードでなにができるか、どうすればよりよく活用できるかを解説します。しっかりと活用していくための知識と、現場で活用できる実践が身に付く必携の一冊です。 目次 1. 生成AIエンジニアリングの常識を変える 1. 変化は「今」起こっている — さて、どうする? 2. 生成AIへの過度な期待と現実のギャップ 3. プロンプトエンジニアリングのテクニックはあまり重要ではない 4. エンジニア仕事は消えない 5. AIは優秀なエンジニアだけのものではない 6. 開発支援

    コード×AI | 技術評論社
    doko
    doko 2024/09/18