スクレイピング

 

感動的に使える記事。わかりやすい。

ai-inter1.com

 

シンプルに文字だけ抜き出す方法の必要最小限の記載

qiita.com

 

VSCodeを使うところ、csv化は少し参考になる。

qiita.com

 

Macのインストール方法

pip3 install beautifulsoup4

notemite.com

 

BeautifulSoupの改行対策。

teratail.com

 

 

BeautifulSoupの入出力の文字変換。

senablog.com

 

画像ファイルのダウンロード方法。

hashikake.com

 

beautifulsoupに読み込んだ時点で、textをcontentに変更すると文字化けは起きない。

この段階で変えないと以降で面倒になる。または、対応ができなくなる。

orangain.hatenablog.com

 

 

サイトのリンク先からも情報を取る。

rurukblog.com

 

BeautifulSoupとSeleniumの使い方の比較にも役立つ。やった。

Pythonでのインストール方法もやった。

wptech.kiichiro.work

 

MacSeleniumを使うとセキュリティ的にエラーになるので対策が必要。やった。

teshi-learn.com

 

seleniumスクリーンショットのやり方。やった。

qiita.com

 

わかりやすい。基本からある。参考に。

ai-inter1.com

 

Seleniumの便利関数。参考に。

tkstock.site

 

Chromeのインストール、brew版。やったが、今回関係があったか不明。

o-2-s.info

 

Chromeのドライバー変更。やったが、今回関係があったか不明。

tech.yoshinokenji.com

 

 

requestsは相手のサーバーが遅いとタイムアウトエラーになるので、あらかじめタイムアウト時間を設定しておく。

blog.cosnomi.com

 

requestsの次に取れる方法としてrequests-htmlではあったが、

効果はなかった。

gammasoft.jp