複数のファイル置換プログラム(Ruby版)


pdftotextを使って、複数のpdfファイルをカンマ区切りのテキストファイルに変換する。

#!/usr/bin/ruby
#********************************************************
# 置換プログラム (Ruby版)
#********************************************************
#
#  複数のpdfファイルをcsvファイル(カンマ区切りのテキストファイル)に変換する


system("for %I in (*.pdf) do c:/xpdf/pdftotext.exe -raw -enc Shift-JIS -layout %I")

Dir.glob("*.txt") do |file|
	open(file, "r+") do |fh|
		text = fh.read
		text.gsub!(/\n/, ",")
		fh.truncate(0)
		fh.rewind
		fh.write text
	end
end


こうでもいいみたいだね。というか、こっちの方がいいかも。

#!/usr/bin/ruby
#********************************************************
# 置換プログラム (Ruby版)
#********************************************************
#
#  複数のpdfファイルをcsvファイル(カンマ区切りのテキストファイル)に変換する


system("for %I in (*.pdf) do c:/xpdf/pdftotext.exe -raw -enc Shift-JIS -layout %I")

Dir.glob("*.txt"){|file|
	open(file, "r+"){|fh|
		text = fh.read
		text.gsub!(/\n/, ",")
		fh.truncate(0)
		fh.rewind
		fh.write text
	}
}