Seleniumで書いたスクレイピングコード、サイトのHTML構造が変わるたびに壊れてうんざりしてない?
手動でメンテするたびに「これ、AIに任せたい」と思ってたんだけど、browser-use を試したら本当にそれが現実になった。指示を自然言語で書くだけで、ブラウザを操作してデータを取ってきてくれる。しかも2025年初頭から急激にスターが伸びて、2026年3月時点で GitHub スター数 62,000+。今一番熱いブラウザ自動化ライブラリです。
この記事では browser-use の基本セットアップから、スクレイピング・RPA・副業への活用まで、実際に動かした内容をそのまま書く。
browser-useって何者?
一言で言うと「AIエージェントがブラウザを操作するためのPythonライブラリ」です。
従来のSeleniumやPlaywrightは、「このセレクタをクリック」「このフォームに入力」みたいに操作手順をコードで細かく書く必要があった。browser-use はそれを自然言語の指示に置き換えてくれる。裏側はPlaywrightが動いてて、LLM(Claude・GPT-4など)が画面を見ながら次の操作を判断する仕組み。


コメント