SQLの窓

2010年06月20日


Python3.1 : URLを読み出してファイルに出力

注意するのは、キャラクタセットの指定です。

※ Windows では、指定しない場合は SHIFT_JIS で出力されます
0003.py ( utf8n )
#! /usr/bin/env python3.1

import urllib.request

# **********************************************************
# ※ エラーをファイルに出力しています
# ※ file=object は、object に write メソッドが必要です
# ※ python312.chm::/library/functions.html#open
#
# ※ SSL が有効です
# **********************************************************
try:
	response = urllib.request.urlopen('https://mixi.jp/')
except urllib.error.URLError as e:
	print(e,file=open("error.log","at"))
	exit()

html = response.read()

# サーバーからの http ヘッダ
print( response.info() )

# **********************************************************
# ※ ログイン前のページをファイルに出力しています
# 
# ※ python312.chm::/library/codecs.html#standard-encodings
# ※ euc_jp | eucjp, ujis, u-jis 
# ※ mixi は、EUC-JP です
#
# ※ 出力される mixi_home.txt は、SHIFT_JIS になります
# **********************************************************
print( html.decode("euc_jp"),file=open("mixi_home_sjis.txt","wt") )

# **********************************************************
# そのまま EUC-JP で出力
# **********************************************************
print(
	html.decode("euc_jp"),
	file=open(
		"mixi_home_ujis.txt",
		"wt",
		encoding="euc_jp"
	)
)

関連する記事

Python3.1 : URL を読み出す( bytes から string )


タグ:Python
【Pythonの最新記事】
posted by lightbox at 2010-06-20 18:46 | Python | このブログの読者になる | 更新情報をチェックする
container 終わり



フリーフォントで簡単ロゴ作成
フリーフォントでボタン素材作成
フリーフォントで吹き出し画像作成
フリーフォントではんこ画像作成
ほぼ自由に利用できるフリーフォント
フリーフォントの書体見本とサンプル
画像を大きく見る為のウインドウを開くボタンの作成

CSS ドロップシャドウの参考デモ
イラストAC
ぱくたそ
写真素材 足成
フリーフォント一覧
utf8 文字ツール
右サイド 終わり
base 終わり