【python pandas】ファイルから特定の文字列がある行を取得する

python pandasで特定の文字列が含まれる行を取得する方法 トップ画像 python

パイソンでは、データ解析に特化したライブラリとして、pandasがあり、今回をそれを使って、ローカルのcsvファイルにアクセスし、特定の文字列を含む行だけを抽出する方法をお伝えします。いくつかのパイソンのライブラリと併用することで自動化に向けて、時に使用される可能性のある手段です。

コード紹介

import pandas as pd

df = pd.read_csv("〇〇.csv", encoding='cp932',usecols=['name1'])

boxx = df.query('name.str.contains("株式会社")', engine='python')
print(boxx)

上記の場合は、〇〇.csvの”name1″カラムの値を取得し、且つ「株式会社」の文字列を含む行を抽出するコード内容です。

まとめ

パイソンで使用されるseleniumやbeautiful soupなどのライブラリと併用することで、自動取得後のCSVファイルを加工し、自動化のRPAを実現するために必要な手段かと思われます。

コメント

タイトルとURLをコピーしました