Skip to content

Commit

Permalink
Update 2. 日本語デジタルテキスト入門(Introduction to Japanese Digital Text).md
Browse files Browse the repository at this point in the history
reflected the result of the writing meeting on 11-14
  • Loading branch information
kidayasuo authored Nov 26, 2024
1 parent 0efea83 commit 79460d6
Showing 1 changed file with 13 additions and 128 deletions.
Original file line number Diff line number Diff line change
@@ -1,4 +1,5 @@
# 2 日本語デジタルテキスト入門 文字とフォント(Introduction to Japanese Digital Text)
# 2 デジタルテキストの基礎知識 ⸺ 文字とフォント

> - 理論的基礎というよりは、普通の人にも読んで欲しいので「入門 / Introduction to」を使う。
> - この章で、日本語デジタルテキストの基礎、および組版・テキストレイアウトの観点での日本語デジタルテキストの作り方を述べる。対象は、jlreq-dの読者全てであるが、特に日本語テキストを書く人向けに書く。
> - デバイスやスタイルが変わった時を意識して、困らない書き方をしてくださいね。余計なことしないでね。という内容を書けば良い。dos and don’ts を具体的に。
Expand Down Expand Up @@ -238,13 +239,7 @@

一方、全角英数字は縦書きで自動的に縦向きになるので、縦書きでの英字の記号的利用に便利である。

### 漢字
先に述べたように漢字は中国で生まれた文字である。しかし現在使われている漢字の形は、同じ文字コードであっても、日本、中国、台湾など、それぞれの漢字使用地域で相互に異なるので、フォントの使用に注意が必要である。多くの場合読めはするが、使用フォントを間違えると違和感のある、プロフェッショナルでない仕上がりとなる。

![](%E3%82%B9%E3%82%AF%E3%83%AA%E3%83%BC%E3%83%B3%E3%82%B7%E3%83%A7%E3%83%83%E3%83%88%202024-10-25%208.13.10.png)
> 図をアップデート
## 2.4 日本語書体とフォント
## 2.4 フォント
ここで書体とは文字デザインのカテゴリを指し、フォントとは名前のついた具体的な実装を指す。

### 日本語フォントの成り立ち
Expand Down Expand Up @@ -292,11 +287,19 @@ Adobeの定めた日本語文字セット。Adobe-Japan1 の後のsupplement追

特殊な用途の書体に、多くの漫画で使われるアンチック、明朝体でありながら手書きの形を模した学参書体、映画の字幕に使われる字幕用書体などがある。

(10月31日ここまで)
### 日本語には日本語用フォントを使う
先に述べたように漢字は中国で生まれた文字である。しかし現在使われている漢字の形は、同じ文字コードであっても、日本、中国、台湾など、それぞれの漢字使用地域で相互に異なるので、フォントの使用に注意が必要である。多くの場合読めはするが、使用フォントを間違えると違和感のある、プロフェッショナルでない仕上がりとなる。

### 日本語漢字字形、中国語漢字字形の注意
![](%E3%82%B9%E3%82%AF%E3%83%AA%E3%83%BC%E3%83%B3%E3%82%B7%E3%83%A7%E3%83%83%E3%83%88%202024-11-14%209.03.32.png)

日本語用でないフォントでも仮名を含んでいるものがあるが、デザインが洗練されておらず、またウェイトやサイズの漢字に対するバランスが悪いものもあるので注意する。句読点でも位置が異なるなどの問題がある。

[https://press.jp.porsche.com/prod/presse\_pag/PressResources.nsf/Content?ReadForm&languageversionid=1634483&view=1](https://press.jp.porsche.com/prod/presse_pag/PressResources.nsf/Content?ReadForm&languageversionid=1634483&view=1)
![](%E3%82%B9%E3%82%AF%E3%83%AA%E3%83%BC%E3%83%B3%E3%82%B7%E3%83%A7%E3%83%83%E3%83%88%202024-11-14%208.29.49.png)

### 英字書体との合わせ方
(山本さんがきた時に議論)

書体、サイズとウェイトの合わせ方。

日本語コンテキストであって特に意図のない場合は、日本語フォントに含まれる英字を使うのが賢明である。そのフォントの和字と使われることを念頭に、上下位置、サイズ、ウェイト、などを揃えてデザインされているからである。例えば和文書体に含まれる英字は和文との相性が良いように、特に下へのはみ出し(ディセンダ)が小さくデザインされている。
Expand All @@ -310,121 +313,3 @@ Adobeの定めた日本語文字セット。Adobe-Japan1 の後のsupplement追

ウェイト:

## 2.5 段落のスタイル
段落は意味の単位である。段落(パラグラフ)にはいくつかのスタイルがある。代表的なものを示す。なお、下に示した段落スタイルの名前は特に定まったものがなく、この文書での名前である。

ウェブにはテキストとスタイルを分離するという原則がある。段落においては、テキストを特定の段落スタイル専用に変更することなしに、異なる段落スタイルを適用できるのが理想的である。

千鳥書きなど、文の構造に従って固定的な行送りを行うような特殊な場合を除いて、段落は改行を含まないひと続きのテキストであり、そのようにデータを作成すべきである。そのことによって、環境に応じた行の折り返しが可能になる。

> 段落、と言うより段落のインデントの方式について述べている?
#### ブロック段落
各段落の最初の行をインデントせず、段落間の間隔を開ける。ウェブやメール含め、デジタルテキストはこの形式がデフォルトになっていることが多い。ブロック段落では段落の境界を視覚的に捉えやすい。段落間の間隔のために文が上下に長くなる。これは紙に印刷する場合にページ数とコストに影響するため重要となるが、デジタルテキストにおいては問題とはならない。

> 日本語、英語、それぞれの印刷でブロック段落を使っているものにはどんなものがあるか?
#### 字下げ段落
各段落の最初の行をインデントし、段落間に空白行を入れない。活版印刷が普及し始めた明治時代以降の書籍はこの形式であり、フォーマルな印象を与える。段落境界はブロック段落に比べると視覚的に見えにくくなる。

日本語ではインデント量は全角一文字分であり、また英語と異なり、章や節の最初の段落であってもインデントを行う(サイドノートに、英語での字下げはもっと大きく、また中国語では二全角分、などの説明をするか?)。

アプリケーションは段落に用いられている文字の全角空白の幅を単位としたインデント量を設定できる必要がある。代わりの方法として、段落の先頭に全角空白文字を挿入する方法があるが、こうするとテキストデータが字下げ段落専用になってしまい、後に他の段落スタイルを適用するためにテキストの改変が必要になる。

#### ぶら下がりインデント
字下げ段落と反対に、段落の最初の行はインデントせず、2行目以降をインデントする。リストや引用文で使用される。段落の始まりを特に強調できるので、リストに用いることで情報の整理に役立つ。通常、字下げ段落と同様に、段落間に空白行を入れない。

この方法は文の折り返した部分がインデントするため、アプリケーションに一行目と二行目以降のインデント量を変更する機能のある場合にのみ可能となる。
(これは行揃えの種類?)

> 注と箇条書き
## 2.6 行揃えのスタイル
> 厳密には段落のスタイルと分けにくいが、ここでは、強制改行のない一つ付きのテキストからなるテキストが、どのように折り畳まれるか、を行揃えとして扱う。
#### 両端揃え
- 字間が行の調整の影響を受ける
- 行長を全角の整数倍にする必要がある
- 各行の左右両端が揃っているため、全体に均一で整っている印象
- 新聞、雑誌、書籍の本文など
>
#### 行頭揃え
- 右が不揃い
- 字間が常に保たれる
- ウェブページなど

#### 行末揃え
- 行頭が不揃い
- 目次やキャプションなどで使われることがある

#### 中央揃え
段落全体が中央揃えになる。この方法はタイトルや見出し、詩など、特定のコンテンツで強調効果がある。

#### 千鳥書き
ニュース原稿、詩、和歌など。次の行の先頭が前の行からインデントされて、次々に行の先頭の位置がずれてゆく方式。日本語の場合、文節などの語句の句切れで行を折り返す。前の行の行末から次の行の行頭への視線の移動が容易で、アクセシビリティに優れていることが知られている(論文)。
![](2024%E7%B7%B4%E7%BF%92%E7%94%A8%E3%83%8B%E3%83%A5%E3%83%BC%E3%82%B9%E5%8E%9F%E7%A8%BF%E4%BA%AC%E9%83%BD%E9%96%A2%E9%80%A3%20(1)%EF%BC%88%E3%83%88%E3%82%99%E3%83%A9%E3%83%83%E3%82%AF%E3%82%99%E3%81%95%E3%82%8C%E3%81%BE%E3%81%97%E3%81%9F%EF%BC%89.pdf)

#### 均等割付け
- 両端揃えでは、段落末は成り行きで、行末に揃えないが、均等割付けは段落末を行末位置に揃える。

#### 強制的な改行を伴う揃え
通常、一つの段落は改行の入らない一続きのテキストであり、表示の柔軟性を確保するためにも強制的な改行は避けるべきである。しかし、文の語句のまとまりに従って強制的に改行する方法の利点もある。語句のまとまりが強調され、文の構造が捉えやすくなる。特に中央揃え、行末揃え、千鳥書きなどで効果的に利用される。固定のフォーマットとなるので、画面の大きさ、特に幅の変化への追従が限定的となる。よって異なる画面サイズに対して複数の改行方法を取る必要のある場合もある。

## 2.7 ルビ
> ルビの概説をどこかに。手動自動、ふりがな、カタカナルビ、注的。
> 著者のテキストにないルビが増えてゆく。自動生成の話題。
> どんどんつければ良いと言う方向に解釈されないように
## 2.8 横書きと縦書き
> 縦書きのあること。伝統的なテキストの方向であること。数字や欧米の単語の影響で、横書きが増えたこと。縦書きの問題点を説明(算用数字や英単語などが読みにくくなる)。
> 伝統的な縦書きのスタイルの横書きとの違いを説明。両方の方向に対応したテキストデータを作成するための問題点。横書きを縦書きにする時の問題点、解決方法。
対処方法:
1. 両方に適した書き方にする
2. 両方に最適化
3. 片方用に書いたものを両方にそのまま適用



----
## どこかに書く
## 𝑥.𝑥 Unicodeの見地からの日本語文字セット(jlreq-dのどこかに入れる?)
> 昨今、JIS文字セットよりもUnicode文字セットの方が日本語に関して先を行っている。絵文字や変体仮名はその一つ。また、濁音付きの任意の仮名が表現できるのもUnicodeならでは。
> Unicodeを出発点とした日本語文字セットまたはグリフセットを考えるべきではないだろうか。
> Unicodeに欠けている文字:
> JLReq TFによる以前の調査で「要和文文字」とされたのは以下:
> U+2010 HYPHEN
> U+2013 EN DASH
> U+2014 EM DASH
> U+2025 TWO DOT LEADER
> U+2026 HORIZONTAL ELLIPSIS
> U+2018 LEFT SINGLE QUOTATION MARK
> U+2019 RIGHT SINGLE QUOTATION MARK
> U+201C LEFT DOUBLE QUOTATION MARK
> U+201D RIGHT DOUBLE QUOTATION MARK
> また、JLReqに現れる、二倍ダッシュ、二倍三点リーダ、二倍二点リーダ、は文字コード、もしくはグリフが欲しい。強力な分割禁止。欧文には以下の文字がUnicodeにある。
> U+2E3A TWO-EM DASH
> U+2E3B THREE-EM DASH
> 1/3, 1/4, 1/6 EM SPACE
> (他にもEM何ちゃらがあるかもしれない。要チェック)
----
### テキストの構造
> スタイルに触れずにプレーンテキストのレベルで文書の構造を述べると、却って内容が抽象的で高度になる。ので、第3章に移動。
> 段落は明示的な改行の入らない一続きのテキスト。先頭に空白を入れるべきではない。が、実際には、全角の単位でインデントできるアプリケーションは2024年現時点では少ない。その場合全角空白を挿入する。
> HTMLなど、改行で区切られたテキストをひとまとまりの段落にまとめる機能がある場合、その機能は和字の周辺に空白を入れるべきでない。が、そのようにしていないアプリケーションが多いので注意。その場合は空白が入るべき箇所で切るか、複数行に分けない。
> 見出しについて何か言う事はあるか? もし対象がHTMLやmarkdownならスタイルではなく、マークアップで示せよ、とは言えるが……
### 必要とするシステムの能力(第3章で触れることがあるなら第3章)
> 言いたいこと:結合文字(テスト:使いやすいテストケースはある?)やサロゲート(テスト:絵文字、もしくはサロゲートの必要な特定の漢字を示して、それが正常に表示でき、編集できる)をサポートしているシステムを選ぶこと!(非Unicodeシステムについては範囲外なので述べない)
## 他の章でカバーするべきこと

- 正しい約物や記号の入力支援。入力プログラムの機能や、テキストシステムの機能として。
## 2章か3章に

- 読みやすくするための工夫は、読点だけではなく、語句を漢字にしたり仮名に開いたりする、語彙自体を工夫する、助詞を省いたりあえて加えたり、などの手段があると思いますが、これらは触れるとしたら書き手のための2章がより適当?

0 comments on commit 79460d6

Please sign in to comment.