Java Web Crawler: Difference between revisions

Revision as of 11:54, 10 October 2020

A web crawler, or spider, is a type of bot that's typically operated by search engines like Google and Bing. Their purpose is to index the content of websites all across the Internet so that those websites can appear in search engine results.

Selenium

docker run --detach \
--publish 4444:4444 \
--hostname firefox \
--name firefox \
--shm-size 2g \
selenium/standalone-firefox:80.0

--OR--

docker run --detach \
--publish 4444:4444 \
--hostname firefox \
--name firefox \
--volume /dev/shm:/dev/shm \
selenium/standalone-firefox:80.0

docker exec -it firefox cat /etc/hosts
http://localhost:4444/wd/hub

docker run --detach \
--publish 4444:4444 \
--hostname chrome \
--name chrome \
--shm-size 2g \
selenium/standalone-chrome:85.0

--OR--

docker run --detach \
--publish 4444:4444 \
--hostname chrome \
--name chrome \
--volume /dev/shm:/dev/shm \
selenium/standalone-chrome:85.0

docker exec -it chrome cat /etc/hosts
http://localhost:4444/wd/hub

docker run --detach \
--publish 4444:4444 \
--hostname opera \
--name opera \
--shm-size 2g \
selenium/standalone-opera:71.0

--OR--

docker run --detach \
--publish 4444:4444 \
--hostname opera \
--name opera \
--volume /dev/shm:/dev/shm \
selenium/standalone-opera:71.0

docker exec -it opera cat /etc/hosts
http://localhost:4444/wd/hub

References

Selenium Jupiter

@@ Line 104: / Line 104: @@
 * [https://hub.docker.com/r/selenium/standalone-opera Docker Image <code>selenium/standalone-opera</code>]
 ----
+* [https://github.com/bonigarcia/selenium-jupiter Selenium Jupiter]
 |}

Java Web Crawler: Difference between revisions

Revision as of 11:54, 10 October 2020

Selenium

References

Navigation menu

Search