GARA::LOG

今はAirRegiから吐き出されるCSVから分析プログラム制作=//

Python3でフォルダ内の複数ファイルをまとめてエンコード確認

◎フォルダ内の複数ファイルをまとめてエンコードの確認をしたい。

文字コード:ShiftJISからUTF-8に変更した際の確認
フォルダ:./u_data/utf8_2017/
ファイル:201704.csv~201712.csv
プログラミング言語:Python3

# フォルダ内の複数ファイルをまとめてエンコード確認する
import chardet
import glob

# フォルダ内のファイルリストを取得する
folder = glob.glob('./u_data/utf8_2017/*')

# 取得したファイルを順にopen関数に設置
for file in folder:
    
# 文字コードの確認
    with open(file,"rb") as f:
            print(file,chardet.detect(f.read()))

○結果

./u_data/utf8_2017/201707.csv {'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}
./u_data/utf8_2017/201712.csv {'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}
./u_data/utf8_2017/201704.csv {'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}
./u_data/utf8_2017/201706.csv {'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}
./u_data/utf8_2017/201705.csv {'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}
./u_data/utf8_2017/201709.csv {'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}
./u_data/utf8_2017/201710.csv {'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}
./u_data/utf8_2017/201711.csv {'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}
./u_data/utf8_2017/201708.csv {'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}