Skip to content

Selenium Docker

Решим задачу парсинга информации с веб-сайтов с динамическим рендером информации. Обычно такие сайты применяют React или Angular. Обычными штатными средствами парсить такой тип информации будет либо невозможно, либо очень трудоемко.

Docker

Перед тем как перейти к практике, самостоятельно изучи сущности на изображении выше.

Selenium в Docker

Selenium — это фреймворк для автоматизированного тестирования веб-приложений. Он позволяет автоматизировать действия, которые пользователь может совершать в браузере, такие как:

  • нажатие кнопок;

  • заполнение форм;

  • переход по ссылкам.

Это помогает разработчикам проверять функциональность своих приложений и исключать ошибки.

Можно было бы установить Selenium локально, затем установить к нему драйвер и обращаться к Selenium с помощью программного кода, но это трудоемкая задача, занимающая определенное время.

  1. Сэкономим время и воспользуемся готовым Docker-образом:

docker run --rm -p 4444:4444 selenium/standalone-chrome

Где флаг --rm указывает нам на то, что контейнер будет удален автоматически после своей остановки.

  1. После этого мы можем пройти по адресу http://localhost:4444, где у нас находится веб-интерфейс Selenium.

На картинке отображается инстанс нашего Selenium. Мы не добавили никаких флагов от самого образа, передающихся через environment variables, поэтому Selenium запущен с default-настройками.

Документацию по образу рекомендуем найти в гугле (по запросу Docker Hub Selenium). Далее найди образ, который мы используем, для ознакомления с документацией.