21. カテゴリ名を含む行を抽出
記事中でカテゴリ名を宣言している行を抽出せよ.
import json
import re
def wiki_selection():
with open("D:\\nlp100\\jawiki-country.json",encoding="UTF-8") as fr:
wiki_line = fr.readline()
while wiki_line:
wiki_dic = json.loads(wiki_line)
if wiki_dic["title"] == "イギリス":
return wiki_dic["text"]
wiki_line =fr.readline()
text = wiki_selection()
for line in re.findall(r".*Category.*",text):
print(line)
<結果>
[[Category:イギリス|*]]
[[Category:英連邦王国|*]]
[[Category:G8加盟国]]
[[Category:欧州連合加盟国]]
[[Category:海洋国家]]
[[Category:君主国]]
[[Category:島国|くれいとふりてん]]