言語処理100本ノック

17. 1列目の文字列の異なり

1列目の文字列の種類(異なる文字列の集合)を求めよ.確認にはsort, uniqコマンドを用いよ.

fr = open("D:\\nlp100\\hightemp.txt",encoding="UTF-8")
list = fr.readlines()
fr.close()
coll = set()
for i in list:
    coll.add(i.split()[0])
print(coll)

<結果>
{'岐阜県', '和歌山県', '大阪府', '山梨県', '愛媛県', '高知県', '山形県', '愛知県', '千葉県', '静岡県', '埼玉県', '群馬県'}