Python-pandas-working-with-text-data
Python Pandas-テキストデータの操作
この章では、基本的なシリーズ/インデックスを使用した文字列操作について説明します。 後続の章では、これらの文字列関数をDataFrameに適用する方法を学習します。
Pandasは、文字列データの操作を容易にする一連の文字列関数を提供します。 最も重要なことは、これらの関数は欠損/NaN値を無視(または除外)することです。
ほとんどの場合、これらのメソッドはすべてPython文字列関数で機能します(https://docs.python.org/3/library/stdtypesl#string-methodsを参照)。 そのため、SeriesオブジェクトをStringオブジェクトに変換してから、操作を実行します。
各操作の実行方法を見てみましょう。
Sr.No | Function & Description |
---|---|
1 |
lower() シリーズ/インデックスの文字列を小文字に変換します。 |
2 |
upper() Series/Indexの文字列を大文字に変換します。 |
3 |
len() String length()を計算します。 |
4 |
strip() 両側のSeries/indexの各文字列から空白(改行を含む)を取り除くのに役立ちます。 |
5 |
split(' ') 指定されたパターンで各文字列を分割します。 |
6 |
cat(sep=' ') シリーズ/インデックス要素を指定されたセパレータで連結します。 |
7 |
get_dummies() ワンホットエンコード値でDataFrameを返します。 |
8 |
contains(pattern) 部分文字列が要素に含まれる場合は各要素に対してブール値Trueを返し、そうでない場合はFalseを返します。 |
9 |
replace(a,b) 値 a を値 b に置き換えます。 |
10 |
repeat(value) 指定された回数で各要素を繰り返します。 |
11 |
count(pattern) 各要素のパターンの出現回数を返します。 |
12 |
startswith(pattern) Series/Indexの要素がパターンで始まる場合、trueを返します。 |
13 |
endswith(pattern) Series/Indexの要素がパターンで終わる場合、trueを返します。 |
14 |
find(pattern) パターンが最初に現れる最初の位置を返します。 |
15 |
findall(pattern) パターンのすべての出現のリストを返します。 |
16 |
swapcase ケースの下部/上部を交換します。 |
17 |
islower() シリーズ/インデックスの各文字列のすべての文字が小文字かどうかを確認します。 ブール値を返します |
18 |
isupper() Series/Indexの各文字列のすべての文字が大文字かどうかを確認します。 ブール値を返します。 |
19 |
isnumeric() シリーズ/インデックスの各文字列のすべての文字が数値であるかどうかを確認します。 ブール値を返します。 |
ここでシリーズを作成し、上記のすべての機能がどのように機能するかを見てみましょう。
その*出力*は次のとおりです-
lower()
その*出力*は次のとおりです-
アッパー()
その*出力*は次のとおりです-
len()
その*出力*は次のとおりです-
ストリップ()
その*出力*は次のとおりです-
split(パターン)
その*出力*は次のとおりです-
cat(sep = pattern)
その*出力*は次のとおりです-
get_dummies()
その*出力*は次のとおりです-
含む()
その*出力*は次のとおりです-
replace(a、b)
その*出力*は次のとおりです-
繰り返し(値)
その*出力*は次のとおりです-
カウント(パターン)
その*出力*は次のとおりです-
startswith(パターン)
その*出力*は次のとおりです-
endswith(パターン)
その*出力*は次のとおりです-
find(パターン)
その*出力*は次のとおりです-
「-1」は、そのようなパターンが要素にないことを示します。
findall(パターン)
その*出力*は次のとおりです-
Null list([])は、要素にそのようなパターンが存在しないことを示します。
swapcase()
その*出力*は次のとおりです-
islower()
その*出力*は次のとおりです-
isupper()
その*出力*は次のとおりです-
isnumeric()
その*出力*は次のとおりです-