csv結合し重複削除

こんにちは。chanyoGUITARと申します。今回は掲題の件を記事にさせていただきました。

それでは行きましょう!

Pythonでcsvファイルを結合するには、pandasを使います。pandasを使えば、簡単にcsvファイルを結合することができます。

次のコードは、2つのcsvファイルを結合して、3列目の重複を削除する方法を示しています。

import pandas as pd

# csvファイルの読み込み
df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')

# csvファイルの結合
df = pd.concat([df1, df2])

# 重複を削除
df = df.drop_duplicates(subset=2)

# 結果を出力
df.to_csv('result.csv', index=False)

subset=2のところで3列目の重複をなくしています。文字列で与えても大丈夫で、subset=”型番”などのようにしても実現できます。

今回はシンプルでしたが、このコードの一部分を応用すれば様々な状況にも対応できますので、一部分だけコピーするなどしていただいて構いません。 また間違い等あればお気軽にコメントください!! 以上です!

記事は毎日投稿の予定なので、明日もぜひのぞいてみてください!それでは!

コメント

タイトルとURLをコピーしました