10.10。 標準ライブラリの簡単なツアー
10.1。 オペレーティングシステムインターフェイス
os モジュールは、オペレーティングシステムと対話するための数十の機能を提供します。
>>> import os
>>> os.getcwd() # Return the current working directory
'C:\\Python26'
>>> os.chdir('/server/accesslogs') # Change current working directory
>>> os.system('mkdir today') # Run the command mkdir in the system shell
0
from os import *
の代わりにimport os
スタイルを使用してください。 これにより、 os.open()が、動作が大きく異なる組み込みの open()関数をシャドウイングするのを防ぎます。
組み込みの dir()および help()関数は、 os のような大きなモジュールを操作するためのインタラクティブな補助として役立ちます。
>>> import os
>>> dir(os)
<returns a list of all module functions>
>>> help(os)
<returns an extensive manual page created from the module's docstrings>
毎日のファイルおよびディレクトリ管理タスクの場合、 shutil モジュールは、より使いやすい高レベルのインターフェイスを提供します。
>>> import shutil
>>> shutil.copyfile('data.db', 'archive.db')
>>> shutil.move('/build/executables', 'installdir')
10.2。 ファイルワイルドカード
glob モジュールは、ディレクトリワイルドカード検索からファイルリストを作成するための関数を提供します。
>>> import glob
>>> glob.glob('*.py')
['primes.py', 'random.py', 'quote.py']
10.3。 コマンドライン引数
一般的なユーティリティスクリプトは、多くの場合、コマンドライン引数を処理する必要があります。 これらの引数は、 sys モジュールの argv 属性にリストとして格納されます。 たとえば、次の出力は、コマンドラインでpython demo.py one two three
を実行した結果です。
>>> import sys
>>> print sys.argv
['demo.py', 'one', 'two', 'three']
getopt モジュールは、Unix getopt()関数の規則を使用して sys.argv を処理します。 より強力で柔軟なコマンドライン処理は、 argparse モジュールによって提供されます。
10.4。 エラー出力リダイレクトとプログラム終了
sys モジュールには、 stdin 、 stdout 、および stderr の属性もあります。 後者は、 stdout がリダイレクトされた場合でも、警告とエラーメッセージを発行してそれらを表示するのに役立ちます。
>>> sys.stderr.write('Warning, log file not found starting a new one\n')
Warning, log file not found starting a new one
スクリプトを終了する最も直接的な方法は、sys.exit()
を使用することです。
10.5。 文字列パターンマッチング
re モジュールは、高度な文字列処理のための正規表現ツールを提供します。 複雑なマッチングと操作の場合、正規表現は簡潔で最適化されたソリューションを提供します。
>>> import re
>>> re.findall(r'\bf[a-z]*', 'which foot or hand fell fastest')
['foot', 'fell', 'fastest']
>>> re.sub(r'(\b[a-z]+) \1', r'\1', 'cat in the the hat')
'cat in the hat'
単純な機能のみが必要な場合は、読み取りとデバッグが簡単な文字列メソッドが推奨されます。
>>> 'tea for too'.replace('too', 'two')
'tea for two'
10.6。 数学
math モジュールは、浮動小数点演算の基礎となるCライブラリ関数へのアクセスを提供します。
>>> import math
>>> math.cos(math.pi / 4.0)
0.70710678118654757
>>> math.log(1024, 2)
10.0
random モジュールは、ランダムな選択を行うためのツールを提供します。
>>> import random
>>> random.choice(['apple', 'pear', 'banana'])
'apple'
>>> random.sample(xrange(100), 10) # sampling without replacement
[30, 83, 16, 4, 8, 81, 41, 50, 18, 33]
>>> random.random() # random float
0.17970987693706186
>>> random.randrange(6) # random integer chosen from range(6)
4
10.7。 インターネット・アクセス
インターネットにアクセスし、インターネットプロトコルを処理するためのモジュールがいくつかあります。 最も単純な2つは、URLからデータを取得するための urllib2 と、メールを送信するための smtplib です。
>>> import urllib2
>>> for line in urllib2.urlopen('http://tycho.usno.navy.mil/cgi-bin/timer.pl'):
... if 'EST' in line or 'EDT' in line: # look for Eastern Time
... print line
<BR>Nov. 25, 09:43:32 PM EST
>>> import smtplib
>>> server = smtplib.SMTP('localhost')
>>> server.sendmail('[email protected]', '[email protected]',
... """To: [email protected]
... From: [email protected]
...
... Beware the Ides of March.
... """)
>>> server.quit()
(2番目の例では、ローカルホストで実行されているメールサーバーが必要であることに注意してください。)
10.8。 日付と時刻
datetime モジュールは、単純な方法と複雑な方法の両方で日付と時刻を操作するためのクラスを提供します。 日付と時刻の計算はサポートされていますが、実装の焦点は、出力のフォーマットと操作のための効率的なメンバー抽出にあります。 このモジュールは、タイムゾーンを認識するオブジェクトもサポートしています。
>>> # dates are easily constructed and formatted
>>> from datetime import date
>>> now = date.today()
>>> now
datetime.date(2003, 12, 2)
>>> now.strftime("%m-%d-%y. %d %b %Y is a %A on the %d day of %B.")
'12-02-03. 02 Dec 2003 is a Tuesday on the 02 day of December.'
>>> # dates support calendar arithmetic
>>> birthday = date(1964, 7, 31)
>>> age = now - birthday
>>> age.days
14368
10.9。 データ圧縮
一般的なデータのアーカイブおよび圧縮形式は、 zlib 、 gzip 、 bz2 、 zipfile 、 tarfile [ X167X]。
>>> import zlib
>>> s = 'witch which has which witches wrist watch'
>>> len(s)
41
>>> t = zlib.compress(s)
>>> len(t)
37
>>> zlib.decompress(t)
'witch which has which witches wrist watch'
>>> zlib.crc32(s)
226805979
10.10。 パフォーマンス測定
一部のPythonユーザーは、同じ問題に対するさまざまなアプローチの相対的なパフォーマンスを知ることに深い関心を持っています。 Pythonは、これらの質問にすぐに答える測定ツールを提供します。
たとえば、引数を交換する従来のアプローチの代わりに、タプルのパッキングおよびアンパック機能を使用したくなる場合があります。 timeit モジュールは、適度なパフォーマンス上の利点をすばやく示します。
>>> from timeit import Timer
>>> Timer('t=a; a=b; b=t', 'a=1; b=2').timeit()
0.57535828626024577
>>> Timer('a,b = b,a', 'a=1; b=2').timeit()
0.54962537085770791
timeit の細かいレベルとは対照的に、 profile および pstats モジュールは、コードのより大きなブロック内のタイムクリティカルセクションを識別するためのツールを提供します。
10.11。 品質管理
高品質のソフトウェアを開発するための1つのアプローチは、開発時に各機能のテストを作成し、開発プロセス中にそれらのテストを頻繁に実行することです。
doctest モジュールは、モジュールをスキャンし、プログラムのdocstringに埋め込まれたテストを検証するためのツールを提供します。 テストの構築は、一般的な呼び出しとその結果を切り取ってdocstringに貼り付けるのと同じくらい簡単です。 これにより、ユーザーに例を提供することでドキュメントが改善され、doctestモジュールがコードがドキュメントに忠実であることを確認できるようになります。
def average(values):
"""Computes the arithmetic mean of a list of numbers.
>>> print average([20, 30, 70])
40.0
"""
return sum(values, 0.0) / len(values)
import doctest
doctest.testmod() # automatically validate the embedded tests
unittest モジュールは、 doctest モジュールほど簡単ではありませんが、より包括的なテストのセットを別のファイルに保持できます。
import unittest
class TestStatisticalFunctions(unittest.TestCase):
def test_average(self):
self.assertEqual(average([20, 30, 70]), 40.0)
self.assertEqual(round(average([1, 5, 7]), 1), 4.3)
with self.assertRaises(ZeroDivisionError):
average([])
with self.assertRaises(TypeError):
average(20, 30, 70)
unittest.main() # Calling from the command line invokes all tests
10.12。 電池が含まれています
Pythonには「バッテリーを含む」という哲学があります。 これは、より大きなパッケージの洗練された堅牢な機能を通して最もよくわかります。 例えば:
- xmlrpclib および SimpleXMLRPCServer モジュールを使用すると、リモートプロシージャコールをほとんど簡単なタスクに実装できます。 モジュール名にもかかわらず、XMLの直接的な知識や処理は必要ありません。
- email パッケージは、MIMEやその他のRFC2822ベースのメッセージドキュメントを含む電子メールメッセージを管理するためのライブラリです。 実際にメッセージを送受信する smtplib や poplib とは異なり、電子メールパッケージには、複雑なメッセージ構造(添付ファイルを含む)を構築またはデコードし、インターネットエンコーディングとヘッダープロトコルを実装するための完全なツールセットがあります。
- xml.dom および xml.sax パッケージは、この一般的なデータ交換形式の解析を強力にサポートします。 同様に、 csv モジュールは、一般的なデータベース形式での直接読み取りと書き込みをサポートします。 これらのモジュールとパッケージを組み合わせることで、Pythonアプリケーションと他のツール間のデータ交換が大幅に簡素化されます。
- 国際化は、 gettext 、 locale 、および codecs パッケージを含む多くのモジュールによってサポートされています。