複数のファイル置換プログラム(Ruby版)
pdftotextを使って、複数のpdfファイルをカンマ区切りのテキストファイルに変換する。
#!/usr/bin/ruby #******************************************************** # 置換プログラム (Ruby版) #******************************************************** # # 複数のpdfファイルをcsvファイル(カンマ区切りのテキストファイル)に変換する system("for %I in (*.pdf) do c:/xpdf/pdftotext.exe -raw -enc Shift-JIS -layout %I") Dir.glob("*.txt") do |file| open(file, "r+") do |fh| text = fh.read text.gsub!(/\n/, ",") fh.truncate(0) fh.rewind fh.write text end end
こうでもいいみたいだね。というか、こっちの方がいいかも。
#!/usr/bin/ruby #******************************************************** # 置換プログラム (Ruby版) #******************************************************** # # 複数のpdfファイルをcsvファイル(カンマ区切りのテキストファイル)に変換する system("for %I in (*.pdf) do c:/xpdf/pdftotext.exe -raw -enc Shift-JIS -layout %I") Dir.glob("*.txt"){|file| open(file, "r+"){|fh| text = fh.read text.gsub!(/\n/, ",") fh.truncate(0) fh.rewind fh.write text } }