テキストCSVはちゃんとテキストCSVとして扱うべき †
- ページ:FrontPage
- 投稿者: amano
- 分類: 要望
- 優先順位: 普通
- 状態: 完了
- カテゴリー: Calc 表計算
- 投稿日: 2006-07-13 09:46:07 (木)
- OS: linux x86-32bit
- バージョン: 2.0.1
メッセージ †
「CSVでの日付の扱い 」関連です。 ですが、要望はより広いものです。
読み込む形式にテキストCSVが選べるようになっていますが、 現状ではまともに使えません。勝手に日付に変換したり、 その他、意図的なこともそうでないことも含め、なにが どうなっているのか解りません。これから、逐一見てはいきますが。
そもそも、仕様に問題があります。 テキストCSVを期待しているのですから、 すべてのフィールドをテキスト(バイト列)として読み、 テキストとして書き出す動作を基本とすべきです。
- そもそもCSVとは
M.Kamataki (2006-07-13 10:17:13 (木))
から、はじめないといけません。
何せ、RFCとして規定されたのは、2005年10月ですから、Excel仕様、Calc仕様などがあってもおかしくありません。まぁ、わたしも先ほど、検索で知っただけなので、これから詳細を見ないといけませんが、いちおうそのRFC文書のポイントだけは記しておきます。
- 続報
M.Kamataki (2006-07-13 10:33:30 (木))
Wikipediaの解説とRFC 4180の日本語訳- カンマ区切りテキスト
http://ja.wikipedia.org/wiki/... - RFC4180・日本語訳
http://www.kasai.fm/wiki/rfc4180jp
- カンマ区切りテキスト
- CSVの扱い
amano (2006-07-13 11:00:03 (木))
もちろん、CSVといっても、RFCのもともとのものから
様々に拡張されているでしょうから、それはそれで構わないのです。
ですが、そもそも、(様々な形式の)CSVをちゃんと扱えていないようなのです。
ちゃんと扱えないなら、余計なことをせずに、全てのデータを単なる文字列
として扱うべきです。
たとえば、巨大なCSVデータを読み込み、そのまま -つまり、
出来るだけもとのフォーマットを崩さないように設定して-
保存してみてください。元のデータと違うものが出来てしまうことがあります
(CR/LFは確認済み)。ところが、データによっては、期待通りに動いてくれたりして、
必ずおかしくなるというわけでもないのです。訳が分からない状態なので、安心して
使うことができません。仕様かもしれないし、もしかしたらバグかもしれないという
イヤな状態です。
- やはり不具合か?
amano (2006-07-13 11:43:32 (木))
かなり、解ってきました。
やはり、日付がうまく扱われていません。
faq/3/128の通り、日付の形式を好みのものに変換したのですが、
シート上の表示はOKなものの、保存したときに、違う形式(mm/dd/yyyy)
で保存されます。これは、バグでしょうね。
ところで、まだ、ちゃんと確認はしていませんが、
月のみのデータ、年と月のみのデータは、期待通りのようです。
- 不具合へ
amano (2006-07-13 15:00:05 (木))
どうやら、日付を扱う際の不具合に起因しているようですので、
この議論はこれで終了し、新しく不具合として投稿します。