Selenium Docker
Решим задачу парсинга информации с веб-сайтов с динамическим рендером информации. Обычно такие сайты применяют React или Angular. Обычными штатными средствами парсить такой тип информации будет либо невозможно, либо очень трудоемко.
Docker
Перед тем как перейти к практике, самостоятельно изучи сущности на изображении выше.
Selenium в Docker
Selenium — это фреймворк для автоматизированного тестирования веб-приложений. Он позволяет автоматизировать действия, которые пользователь может совершать в браузере, такие как:
-
нажатие кнопок;
-
заполнение форм;
-
переход по ссылкам.
Это помогает разработчикам проверять функциональность своих приложений и исключать ошибки.
Можно было бы установить Selenium локально, затем установить к нему драйвер и обращаться к Selenium с помощью программного кода, но это трудоемкая задача, занимающая определенное время.
- Сэкономим время и воспользуемся готовым Docker-образом:
docker run --rm -p 4444:4444 selenium/standalone-chrome |
Где флаг --rm указывает нам на то, что контейнер будет удален автоматически после своей остановки.
- После этого мы можем пройти по адресу http://localhost:4444, где у нас находится веб-интерфейс Selenium.
На картинке отображается инстанс нашего Selenium. Мы не добавили никаких флагов от самого образа, передающихся через environment variables, поэтому Selenium запущен с default-настройками.
Документацию по образу рекомендуем найти в гугле (по запросу Docker Hub Selenium). Далее найди образ, который мы используем, для ознакомления с документацией.