[go: up one dir, main page]

タグ

将棋と*algorithmに関するsh19910711のブックマーク (6)

  • 【論文】In deep reinforcement learning, a pruned network is a good networkを読む - TadaoYamaokaの開発日記

    DeepMindがarXiv上で発表した、深層強化学習のモデルを段階的な枝刈りすることでモデルサイズのスケーリングが可能になることを示した「In deep reinforcement learning, a pruned network is a good network」を読んだ際のメモ。 概要 深層強化学習はモデルサイズをスケーリングことは困難だった 段階的に枝刈りすることでスケーリングが可能であることを実証した 枝刈りすることでパフォーマンスも向上する 導入 深層強化学習では訓練中に多数のパラメータが休止状態になる 最近の研究でResNetバックボーンのDQNで段階的な枝刈りで元のパラメータの10%で50%パフォーマンスが向上ことが発見された この論文では、段階的な枝刈りによって、ネットワークのサイズに比例してパフォーマンスが向上することを示す 関連研究 深層強化学習でネットワークを

    【論文】In deep reinforcement learning, a pruned network is a good networkを読む - TadaoYamaokaの開発日記
    sh19910711
    sh19910711 2024/03/14
    "訓練中に多数のパラメータが休止状態 / ResNetバックボーンのDQNで段階的な枝刈りで元のパラメータの10%で50%パフォーマンスが向上 / 段階的な枝刈りを使用すると、パラメータ効率が向上することを示唆" arXiv:2402.12479
  • ぷよぷよAIを作りやすくしてみた - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? ぷよぷよAIを作ることは中々面倒であるという話 私はとあるぷよぷよ好きなプログラマです。 以前はコンピュータ将棋に力を入れて開発していたのですが、最近はぷよぷよAIにハマっています。 こっそり自分で作って、動いているところを見て一人で楽しんでいましたが、やはり他の方が作ったプログラムと対戦させてみたい欲がでてきました。 ただこれが、現状だと難しいのです。 というのも、ぷよぷよAI界は、コンピュータ将棋界ほどインフラが整備されていないからです。 何が足りないのか 1. GUIを作らずに済む仕組みがない まず、ぷよぷよAIを作るうえで面倒な

    ぷよぷよAIを作りやすくしてみた - Qiita
    sh19910711
    sh19910711 2022/08/25
    2019 / "アルゴリズムだけを追求したい開発者にとって絵を書いたり音声を探したり、はたまたそれらを動かしたりするプログラムを書くのは苦痛 / 将棋にはこの問題を解決するための仕組みとしてUSIプロトコルがあります"
  • 流行りの機械学習をフル活用して棋力スカウター開発してみた話(前編) - コンピュータ将棋 Qhapaq

    歴代の名人と今の名人はどちらが強いのか。将棋が強くなる上で必要な力は何であるか。女流棋士は此処数年でどのぐらい強くなったのか。アマチュアトップとプロの実力差はどのぐらいなのか。 こうした問題の答えを得ることは、将棋AIに期待されている大きな仕事の1つです。人間であれば手の評価にブレが出てしまったり、そもそも巨大な棋譜のデータを読み切る事自体が困難であるという問題があります。しかし、コンピュータであれば大量のデータを均一な品質で評価することが可能です。しかも、幾つもの技術的な幸運により昨今の将棋AIは1秒未満の計算でもかなり正確な(ほぼ全ての人間に余裕で勝ち越せるレベルの)盤面評価を行うことが出来ます。 シリーズでは令和時代の機械学習技術(?)を総動員してできるだけ少ない棋譜で正確に棋力を推定できるエンジンの開発を目指していきます。前編では先行研究の検証を通じてデータの可視化の重要さをお見

    流行りの機械学習をフル活用して棋力スカウター開発してみた話(前編) - コンピュータ将棋 Qhapaq
    sh19910711
    sh19910711 2022/03/13
    "将棋ソフトの評価値と勝率の関係はシグモイド関数に似ていることが実験的に知られている / 後編ではKaggleでおなじみの手法を駆使してレートの分布をより美しくしていきます"
  • 将棋盤を画像認識する - LIVESENSE Data Analytics Blog

    Analytics チームで転職会議のレコメンドを開発している @na_o_ys です。今回は業務のことは忘れて、趣味将棋の話をしたいと思います。 この数年で将棋の学習環境はずいぶんリッチになりました。通勤電車では将棋アプリのネット対局をして、自宅ではオープンソースの強豪 AI を使って棋譜検討し、日々将棋を楽しんでいます。 一方で、顔を突き合わせて盤と駒を使って指す対局が一番楽しいのは変わりがありません。 リアルの対局を AI で検討するために、盤面を手軽にコンピュータに入力したい というのが今回のテーマの発端です。 TL;DR 盤上の駒を高い精度で推定することができました。 処理は大きく 2 つのステップからなります。 盤面の正規化 盤面の四隅の座標を特定し、元画像から正規化画像への射影変換を得る マス目毎の内容を推定する マス目毎に画像を切り出し、駒の有無・種類を推定する ちなみに

    将棋盤を画像認識する - LIVESENSE Data Analytics Blog
    sh19910711
    sh19910711 2021/09/25
    "15 万文字の手書き漢字・ひらがなからなる 手書教育漢字データベース ETL8 を利用 / 非常にノイズが少ないクリアな画像データ > 畳み込み層がノイズに対応できず将棋駒をうまく識別できませんでした"
  • サーバーレス将棋 AI ☖ - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?

    サーバーレス将棋 AI ☖ - Qiita
  • 電王・Ponanza開発者が語る、理由がわからないけどスゴイ“怠惰な並列化”

    皆さんこんにちは。 私は将棋プログラム「Ponanza」の作者、山一成と申します。Ponanzaは初めてプロ棋士を破った将棋プログラムで、近年最も強い将棋プログラムと言えると思われます。また、2017年もトッププロ棋士の方と対局することが予定されています。Ponazaの改良のための機械学習に現在ジサトライッペイさんのPC「大紅蓮丸」の計算リソースを借りているのですが、その関係で原稿を書いてとお願いされたので、3回に渡って将棋プログラムの今について、書いていきたいと思います。 フリーランチの終焉、並列化の効率問題 アスキー読者の方々には言うまでもないのですが、まずは近年のCPU事情について解説していきたいと思います。ちょっと昔まではCPUはシングルコアが当たり前で18ヶ月経過すればCPUのトランジスター数は倍になり、性能が向上するという流れが続いていました。ソフトウェアはその性能向上に伴い

    電王・Ponanza開発者が語る、理由がわからないけどスゴイ“怠惰な並列化”
  • 1