* 長文が尻切れトンボに [#x8a456af]
 |RIGHT:|LEFT:|c
 |~ページ|[[OpenOffice.org FAQの登録ページ]]|
 |~投稿者|まーさん|
 |~分類|#listbox3(不具合,faq03,class)|
 |~優先順位|#listbox3(重要,faq03,priority)|
 |~状態|#listbox3(Issues,faq03,state)|
 |~カテゴリー|#listbox3(Writer ワープロ,faq03,category)|
 |~投稿日|2009-12-10 01:17:06 (木)|
 |~OS|Windows XP|
 |~依存するページ|[[Issue #17171>http://ja.openoffice.org/issues/show_bug.cgi?id=17171]]|
 |~バージョン|#listbox3(3.1.0,faq03,version)|
 
 ** メッセージ [#t6d8df1b]
 |LEFT:|c
 |回答ページでは行末に「~」を付加する必要はありません|
  初めて投稿します。
 
  私は年に数回旅行に出て、その行って来た内容を紀行文にしてホームページを作ろうとしている者です。ホームページはIBMの「ホームページビルダー11」を使っております。文章はもちろん、写真も添付して編集しています。~
  そのいくつか完成したものをOOoライターに挿入して、それをさらにPDFにエクスポートして、より見栄えのいいものも並行して作っています。
 
  ところが、そのうちの何作かは挿入すると、文章の途中から切れてしまっていて、尻切れトンボになって、最後まで読めないものが出てきました。文章の切れた部分以降に添付している写真は、その文章の切れた部分で重なるように添付されているのです。
 
  なぜそうなるのか分かりません。共通するのは、そのいずれもがかなり長い文章になっているということです。そこで原因として考えられるのが、ライター自身に字数制限でもあって、ある文字数を超えるとそれ以降は入力されないのではないかということです。ちなみにある作品は65,000字余です。書式設定とかツールのオプションとかそういう設定のありそうな箇所はひと通り見てみましたが、見つけることができませんでした。
 
  そもそも字数制限などあるのか、また、あるとして、それを解除できる方法があるのか、それともその字数制限に甘んじるしかないのか。申し訳ありませんが、ご教授願えませんでしょうか?
 
 ----
 ***試していただきたいこと [#heed5214]
 >M.Kamataki (2009-12-10 11:06:00 (木))~
 ~
 >OOoライターに挿入して~
 ~
 挿入はどのような方法で行っていますか。OpenOffice.orgはHTMLドキュメントも扱えるので、「ファイル」−「開く」メニューから、「開く」ダイアログを使って、目的のHTMLファイルを指定して読み込むとどうなるでしょうか。~
 ~
 文字数制限についてですが、手元のWriterファイルを調べてみると、単一ファイルで9万字、マスタードキュメント(12サブファイル)[*]で17万字扱えていますから、少なくとも6万5千字あたりで制限があるということはないと思います。~
 ~
 [*]マスタードキュメントについては、以下のページを参考にしてください。~
 -[[長文ファイルを複数に分割/統合するマスタードキュメント>http://openoffice-docj.sourceforge.jp/wiki/Documentation/%E3%82%AA%E3%83%BC%E3%83%97%E3%83%B3%E3%82%AA%E3%83%95%E3%82%A3%E3%82%B93%E5%85%A5%E9%96%80%E3%82%AC%E3%82%A4%E3%83%89/Writer:%E5%8A%B9%E7%8E%87%E3%82%88%E3%81%8F%E6%96%87%E6%9B%B8%E3%82%92%E4%BD%9C%E3%82%8B/%E9%95%B7%E6%96%87%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB%E3%82%92%E8%A4%87%E6%95%B0%E3%81%AB%E5%88%86%E5%89%B2%EF%BC%8F%E7%B5%B1%E5%90%88%E3%81%99%E3%82%8B%E3%83%9E%E3%82%B9%E3%82%BF%E3%83%BC%E3%83%89%E3%82%AD%E3%83%A5%E3%83%A1%E3%83%B3%E3%83%88]]~
 
 //
 ***やはり尻切れです。 [#ta4c95d2]
 >まーさん (2009-12-10 12:40:17 (木))~
 ~
  M.Kamatakiさん、さっそくのご返信ありがとうございます。~
 ~
  挿入の方法ですが、普段は「挿入」→「ファイル」で該当のHTMLファイルを出しています。また、言われたとおりに「ファイル」→「開く」→「ファイルを開く」で呼び出してみましたが、同じように同じ箇所で文章が切れています。画像は約80枚ほど添付していますが、これも関係あるのでしょうか?~
 ~
  すみませんが、よろしくお願いします。~
 
 //
 ***サンプルはありますでしょうか [#g1bf0922]
 >M.Kamataki (2009-12-10 13:41:58 (木))~
 ~
 問題を確認できないと回答が難しいです。すでに公開されているWebページでかまいません。URLを教えていただければ確認してみます。どうでしょうか。~
 
 //
 ***まだ公開はしていないのですが… [#l81a4ed3]
 >まーさん (2009-12-10 14:52:04 (木))~
 ~
 元のHTMLファイルとライター上で開いて保存したodtファイルを添付します。~
 
 //
 ***1段落当たりの文字数制限 [#x8cd7d38]
 >はにゃ? (2009-12-10 17:58:26 (木))~
 ~
 該当の html ファイルをみたところ一段落当たりの文字数制限を超えているようです。Writer の一段落には 65535 文字までしか入力できません。添付文章では 74512 文字くらいありますので超えた分が切れているようです。~
 ~
 HTML ファイル内に P タグがないために挿入時に段落が作成されていません。ホームページビルダーを使ったことがないので分かりませんが段落を利用すれば問題ありません。最初から途中までを P タグに入れて挿入してみたところ文章の最後まで表示されました。~
 
 //
 ***段落内改行と段落区切り [#r0d1a131]
 >M.Kamataki (2009-12-10 18:00:14 (木))~
 ~
 わたしもはにゃ? さんと同じ結論です。せっかく書いたので投稿します。~
 ~
 HTMLファイルの最後まで読み込めなかった原因ですが、HTMLファイルの作成方法に問題がありました。HTMLとWriterともに、段落内改行と段落区切り(改行)は区別されます。HTMLでは<BR>タグが段落内改行、<P>タグが段落区切り(改行)です。Writerの場合は、段落内改行がShift+Enter、段落区切り(改行)がEnterです。~
 ~
 サンプルのHTMLファイルを拝見したところ、<P>タグが存在しませんでした。WriterがこのHTMLを解釈しようとした際、<BR>タグで区切られたテキストを1行として扱おうとするようです。この1行の制限に引っかかったと思います。実際、[ファイル]−[新規作成]−[HTMLドキュメント]で扱ってみると、すべてのテキスト内容が1行になってしまい、6万5千字を超えたあたりの制限に引っかかり、以降のテキストが失われました。~
 ~
 サンプルのHTMLファイルの<BR>タグを<P>タグへ機械的に全置換してから、HTMLファイルの挿入を試みたところ、最後まで読み込めました。~
 ~
 これからHTMLファイルを作成する場合は、<P>タグを使い段落を適切に区切るようお勧めします。~
 ~
 たぶん<BR>で区切られたHTMLドキュメントを1行として扱おうとしたため、メモリー的にも負荷がかかり、Writerの動作ももっさりとした感じなったかと思います。~
 
 //
 ***BR [#l02a010e]
 >HTML (2009-12-10 22:16:22 (木))~
 ~
 HTML文書をブラウザで表示して、全文を選択してコピー。~
 一旦メモ帳に貼り付けてから、再度メモ帳のテキストをコピー。~
 Writerに貼り付ければ全ての改行が段落区切りに変換されます。~
 
 //
 ***ありがとうございます [#p9d0d68d]
 >まーさん (2009-12-11 02:48:04 (金))~
 ~
  みなさん、どうもありがとうございました。なぜ、途中で切れるのかよく分かりました。~
 ~
  でも、M.Kamatakiさんの言うような「機械的に全置換」はどのようにすればよいのでしょう?あれだけの長文ですから、一つひとつやっていたのでは、恐ろしく時間がかかります。恥ずかしながら、「ホームページビルダー」を使っていながら、HTMLに関しては、全く知識がありません。いろいろそれらしいところをいじってみましたが、どこで変更ができるのか分かりませんでした。このサイトで質問するべき事柄ではないかと思いますが、もし、ご存知でしたら、合わせて教えていただければ幸いです。~
 
 //
 ***BRタグの置換 [#nef104ac]
 >M.Kamataki (2009-12-11 10:13:34 (金))~
 ~
 ずいぶん昔、「ホームページビルダー」を使ったことがあるんですが、HTMLコードを表示するモードはなかったでしょうか。<BR>などのタグが見える状態になったら、「編集」メニューに「置換」があれば、検索文字列に「<BR>」を、置換文字列に「<P>」指定します。[すべて置換]などのボタンをクリックするとできるのではないでしょうか。~
 ~
 その他の手段として、メモ帳を使うのはどうでしょうか。サンプルのHTMLファイルの文字コードは、UTF-8となっています。基本的には、UTF-8が扱えるエディタがあると便利ですが、Windows XP SP2以降のメモ帳でもUTF-8が扱えるようです。[すべて置換]ボタンのクリック後、かなり時間はかかるようですが、メモ帳でもOKでした。~
 
 //
 ***やはり問題では? [#wac28341]
 >amano (2009-12-11 11:32:10 (金))~
 ~
 察するに、この場合(1行の文字数制限を超えたとき)、ワーニングが出ないのですよね。~
 そうであれば、やはり、"バグ"とすべきではないでしょうか。~
 文字数の制限は仕方ありませんが、ワーニングを出すべきです。~
 ~
 ところで、「機械的に全て置換」する必要はなく、適当な(制限を越えない)ところで人手でタグを挿入すれば良いのでは?~
 
 //
 ***できました。 [#xf206882]
 >まーさん (2009-12-11 12:27:33 (金))~
 ~
  M.Kamatakiさん、ありがとうございます。はにゃ?さんやamanoさんの言われる、適当な箇所で段落を区切る方法やTHMLさんの言われるメモ帳への貼り付けなども試してみます。みなさん、ありがとうございます。~
 ~
  ただ、これからのこともあるので、さらに質問なのですが、<BR>から<P>に全て置き換えをしてみると、段落ごとに1行ほどの空間ができてしまいました。これを置き換え前のように全文同じ行間にする方法はあるのでしょうか?このサイトでの質問事項ではないことは承知しておりますが、もしご存知でしたら、合わせてお願いいたします。 ~
 
 //
 ***行間について [#we88854b]
 >M.Kamataki (2009-12-11 13:00:57 (金))~
 ~
 Web上のことか、Writerのことかわからないのですが、<P>タグ、もしくはEnterキーによる改段落による行間の空きは、デザインで制御すべきものです。~
 ~
 WebならCSS、Writerならスタイルで変更可能です。~
 
 //
 ***問題を確認させてください [#s54d2f34]
 >amano (2009-12-11 13:48:55 (金))~
 ~
 この問題は、HTMLを読み込む際の問題ということですよね。~
 プレインテキストで改行無しの7万文字を読み込ませたところ、段落が自動的に挿入され、すべて読み込まれます。~
 
 //
 ***段落の文字数制限について [#j6a45d31]
 >M.Kamataki (2009-12-12 10:55:16 (土))~
 ~
 OpenOffice.orgの不具合・要望データベースであるIssueTrackerに登録されていました。~
 ~
 Paragraph cannot be longer than 65534 characters~
 http://ja.openoffice.org/issues/show_bug.cgi?id=17171~
 ~
 「不具合」として登録されており、「開始済み」になっていますから、いずれ段落の文字数制限については、改善されると思います。~
 ~
 amanoさんの~
 >プレインテキストで改行無しの7万文字を読み込ませたところ、段落が自動的に挿入され、すべて読み込まれます。~
 ~
 これは知りませんでした。情報ありがとうございます。そうです。HTMLの読み込み時に、<P>タグがないと段落の文字数制限に引っかかってしまう、ということです。~
 
 //
 ***HTMLの読み込み時の問題 [#y670a3f2]
 >M.Kamataki (2009-12-12 11:08:30 (土))~
 ~
 たぶん以下のIssueだと思います。上記の#17171への「重複」になっています。~
 ~
 65534 characters limit per paragraph~
 http://ja.openoffice.org/issues/show_bug.cgi?id=23897~
 
 //
 ***IssueTracker登録済みにします [#ea50ff61]
 >M.Kamataki (2009-12-15 10:56:43 (火))~
 ~
 IssueTrackerに「不具合」として登録されているIssue #17171が修正されれば、<P>タグがないHTMLファイルでも、ご質問の問題は起きなくなります。~
 ~
 現状、「適度に<P>タグを含める」が回避策になりますが、IssueTrackerに報告済みの問題なので、IssueTracker登録済みにしておきます。~
 
 //
 #article