[B! 将棋][*algorithm] sh19910711のブックマーク

【論文】In deep reinforcement learning, a pruned network is a good networkを読む - TadaoYamaokaの開発日記

DeepMindがarXiv上で発表した、深層強化学習のモデルを段階的な枝刈りすることでモデルサイズのスケーリングが可能になることを示した「In deep reinforcement learning, a pruned network is a good network」を読んだ際のメモ。概要深層強化学習はモデルサイズをスケーリングことは困難だった段階的に枝刈りすることでスケーリングが可能であることを実証した枝刈りすることでパフォーマンスも向上する導入深層強化学習では訓練中に多数のパラメータが休止状態になる最近の研究でResNetバックボーンのDQNで段階的な枝刈りで元のパラメータの10%で50%パフォーマンスが向上ことが発見されたこの論文では、段階的な枝刈りによって、ネットワークのサイズに比例してパフォーマンスが向上することを示す関連研究深層強化学習でネットワークを

sh19910711 2024/03/14

"訓練中に多数のパラメータが休止状態 / ResNetバックボーンのDQNで段階的な枝刈りで元のパラメータの10%で50%パフォーマンスが向上 / 段階的な枝刈りを使用すると、パラメータ効率が向上することを示唆" arXiv:2402.12479

リンク

ぷよぷよAIを作りやすくしてみた - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? ぷよぷよAIを作ることは中々面倒であるという話私はとあるぷよぷよ好きなプログラマです。以前はコンピュータ将棋に力を入れて開発していたのですが、最近はぷよぷよAIにハマっています。こっそり自分で作って、動いているところを見て一人で楽しんでいましたが、やはり他の方が作ったプログラムと対戦させてみたい欲がでてきました。ただこれが、現状だと難しいのです。というのも、ぷよぷよAI界は、コンピュータ将棋界ほどインフラが整備されていないからです。何が足りないのか 1. GUIを作らずに済む仕組みがないまず、ぷよぷよAIを作るうえで面倒な

sh19910711 2022/08/25

2019 / "アルゴリズムだけを追求したい開発者にとって絵を書いたり音声を探したり、はたまたそれらを動かしたりするプログラムを書くのは苦痛 / 将棋にはこの問題を解決するための仕組みとしてUSIプロトコルがあります"

リンク

流行りの機械学習をフル活用して棋力スカウター開発してみた話（前編） - コンピュータ将棋 Qhapaq

歴代の名人と今の名人はどちらが強いのか。将棋が強くなる上で必要な力は何であるか。女流棋士は此処数年でどのぐらい強くなったのか。アマチュアトップとプロの実力差はどのぐらいなのか。こうした問題の答えを得ることは、将棋 AIに期待されている大きな仕事の１つです。人間であれば手の評価にブレが出てしまったり、そもそも巨大な棋譜のデータを読み切る事自体が困難であるという問題があります。しかし、コンピュータであれば大量のデータを均一な品質で評価することが可能です。しかも、幾つもの技術的な幸運により昨今の将棋 AIは１秒未満の計算でもかなり正確な（ほぼ全ての人間に余裕で勝ち越せるレベルの）盤面評価を行うことが出来ます。本シリーズでは令和時代の機械学習技術（？）を総動員してできるだけ少ない棋譜で正確に棋力を推定できるエンジンの開発を目指していきます。前編では先行研究の検証を通じてデータの可視化の重要さをお見

sh19910711 2022/03/13

"将棋ソフトの評価値と勝率の関係はシグモイド関数に似ていることが実験的に知られている / 後編ではKaggleでおなじみの手法を駆使してレートの分布をより美しくしていきます"

リンク

将棋盤を画像認識する - LIVESENSE Data Analytics Blog

Analytics チームで転職会議のレコメンドを開発している @na_o_ys です。今回は業務のことは忘れて、趣味の将棋の話をしたいと思います。この数年で将棋の学習環境はずいぶんリッチになりました。通勤電車では将棋アプリのネット対局をして、自宅ではオープンソースの強豪 AI を使って棋譜検討し、日々将棋を楽しんでいます。一方で、顔を突き合わせて盤と駒を使って指す対局が一番楽しいのは変わりがありません。リアルの対局を AI で検討するために、盤面を手軽にコンピュータに入力したいというのが今回のテーマの発端です。 TL;DR 盤上の駒を高い精度で推定することができました。処理は大きく 2 つのステップからなります。盤面の正規化盤面の四隅の座標を特定し、元画像から正規化画像への射影変換を得るマス目毎の内容を推定するマス目毎に画像を切り出し、駒の有無・種類を推定するちなみに

sh19910711 2021/09/25

"15 万文字の手書き漢字・ひらがなからなる手書教育漢字データベース ETL8 を利用 / 非常にノイズが少ないクリアな画像データ > 畳み込み層がノイズに対応できず将棋駒をうまく識別できませんでした"

リンク

サーバーレス将棋 AI ☖ - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?

sh19910711 2016/12/03

リンク

電王・Ponanza開発者が語る、理由がわからないけどスゴイ“怠惰な並列化”

皆さんこんにちは。私は将棋プログラム「Ponanza」の作者、山本一成と申します。Ponanzaは初めてプロ棋士を破った将棋プログラムで、近年最も強い将棋プログラムと言えると思われます。また、2017年もトッププロ棋士の方と対局することが予定されています。Ponazaの改良のための機械学習に現在ジサトライッペイさんのPC「大紅蓮丸」の計算リソースを借りているのですが、その関係で原稿を書いてとお願いされたので、3回に渡って将棋プログラムの今について、書いていきたいと思います。フリーランチの終焉、並列化の効率問題アスキー読者の方々には言うまでもないのですが、まずは近年のCPU事情について解説していきたいと思います。ちょっと昔まではCPUはシングルコアが当たり前で18ヶ月経過すればCPUのトランジスター数は倍になり、性能が向上するという流れが続いていました。ソフトウェアはその性能向上に伴い

sh19910711 2016/10/27

リンク

はてなブックマーク

タグ

関連タグで絞り込む (4)

将棋と*algorithmに関するsh19910711のブックマーク (6)

お知らせ

今週のはてなブックマーク数ランキング（2025年11月第1週）

今週のはてなブックマーク数ランキング（2025年10月第4週）

今週のはてなブックマーク数ランキング（2025年10月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス