芋の独り言

当ブログへのアクセスは当ブログのプライバシーポリシーに同意したものとみなします.

Pythonメモ:新語・流行語大賞の一覧取得

「現代用語の基礎知識」選 ユーキャン 新語・流行語大賞の一覧が欲しいなぁと思った時,いちいちネット開いて手作業でワードを取っていくのは面倒だと感じ, Pythonでやることにしました. rangeの引数は適宜変更するとして,以下で,新語・流行語大賞のワードがズラーっと表示されます. それをコピペしてテキストエディタでペーストすれば一覧のテキストファイルができます.

>>> for i in range(0,36):
    d=requests.get('https://www.jiyu.co.jp/singo/index.php?eid={0:05d}'.format(i))
    f=bs(d.content,'html.parser')
    for j in f.find_all("h3"):
        w=j.string
                if w=='None':
                    continue
                print(w)

似たようなサイトがありました.同様にやると

>>> import requests
>>> from bs4 import BeautifulSoup as bs
>>> d=requests.get('https://bosesound.blog.fc2.com/blog-entry-155.html')
>>> f=bs(d.content,'html.parser')
>>> for i in f.find_all('li'):
    print(i.string)

    

です.ちょっと違うのもとれちゃうんですが,それは手作業で取り除くとしましょう.