2つのリストの差分を出す方法
テーブルのスクレイピングをするときなど、情報があったり、なかったりで、差分を知りたいときがある。リストとリストを比較して、差分を確認するためにはリストが2つ必要。
リストを2つ準備する
1 2 |
title_list = ["会社名","設立","〒","住所","電話番号","HP"] list_name = ["会社名","設立","住所","電話番号"] |
title_listが元のリストだとする。
list_nameは、何らかの処理を行って、新たに作ったリストだとする。
これでリストが2つ出来た。
リストとリストの差分を計算する
1 |
list(set(title_list) - set(list_name)) |
リスト同士を扱う時には、リスト名を括弧で括って、前にsetをつける。set(リスト名)
list( - )
list( set( ) – set( ) )
list( set(リスト名) – set(リスト名) )
元のリスト引く、新たに作ったリスト。
差分を新しいリストにする
1 2 |
check_list = list(set(title_list) - set(list_name)) print(check_list) |
check_listに差分がはいっているとして、それをprint()で表示させる。
全コード
1 2 3 4 5 6 |
title_list = ["会社名","設立","〒","住所","電話番号","HP"] list_name = ["会社名","設立","住所","電話番号"] check_list = list(set(title_list) - set(list_name)) print(check_list) # ['〒', 'HP'] |
これでリスト同士の差分が表示された。