Python3でフォルダ内の複数ファイルをまとめてエンコード確認
◎フォルダ内の複数ファイルをまとめてエンコードの確認をしたい。
文字コード:ShiftJISからUTF-8に変更した際の確認
フォルダ:./u_data/utf8_2017/
ファイル:201704.csv~201712.csv
プログラミング言語:Python3
# フォルダ内の複数ファイルをまとめてエンコード確認する import chardet import glob # フォルダ内のファイルリストを取得する folder = glob.glob('./u_data/utf8_2017/*') # 取得したファイルを順にopen関数に設置 for file in folder: # 文字コードの確認 with open(file,"rb") as f: print(file,chardet.detect(f.read()))
○結果
./u_data/utf8_2017/201707.csv {'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}
./u_data/utf8_2017/201712.csv {'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}
./u_data/utf8_2017/201704.csv {'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}
./u_data/utf8_2017/201706.csv {'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}
./u_data/utf8_2017/201705.csv {'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}
./u_data/utf8_2017/201709.csv {'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}
./u_data/utf8_2017/201710.csv {'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}
./u_data/utf8_2017/201711.csv {'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}
./u_data/utf8_2017/201708.csv {'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}