3.5. 字符串

一個字符串是一個不可改變的字節序列。字符串可以包含任意的數據，包括byte值0，但是通常是用來包含人類可讀的文本。文本字符串通常被解釋爲采用UTF8編碼的Unicode碼點（rune）序列，我們稍後會詳細討論這個問題。

內置的len函數可以返迴一個字符串中的字節數目（不是rune字符數目），索引操作s[i]返迴第i個字節的字節值，i必須滿足0 ≤ i< len(s)條件約束。

s := "hello, world"
fmt.Println(len(s))     // "12"
fmt.Println(s[0], s[7]) // "104 119" ('h' and 'w')

如果試圖訪問超出字符串索引范圍的字節將會導致panic異常：

c := s[len(s)] // panic: index out of range

第i個字節併不一定是字符串的第i個字符，因爲對於非ASCII字符的UTF8編碼會要兩個或多個字節。我們先簡單説下字符的工作方式。

子字符串操作s[i:j]基於原始的s字符串的第i個字節開始到第j個字節（併不包含j本身）生成一個新字符串。生成的新字符串將包含j-i個字節。

fmt.Println(s[0:5]) // "hello"

同樣，如果索引超出字符串范圍或者j小於i的話將導致panic異常。

不管i還是j都可能被忽略，當它們被忽略時將采用0作爲開始位置，采用len(s)作爲結束的位置。

fmt.Println(s[:5]) // "hello"
fmt.Println(s[7:]) // "world"
fmt.Println(s[:])  // "hello, world"

其中+操作符將兩個字符串鏈接構造一個新字符串：

fmt.Println("goodbye" + s[5:]) // "goodbye, world"

字符串可以用==和<進行比較；比較通過逐個字節比較完成的，因此比較的結果是字符串自然編碼的順序。

字符串的值是不可變的：一個字符串包含的字節序列永遠不會被改變，當然我們也可以給一個字符串變量分配一個新字符串值。可以像下面這樣將一個字符串追加到另一個字符串：

s := "left foot"
t := s
s += ", right foot"

這併不會導致原始的字符串值被改變，但是變量s將因爲+=語句持有一個新的字符串值，但是t依然是包含原先的字符串值。

fmt.Println(s) // "left foot, right foot"
fmt.Println(t) // "left foot"

因爲字符串是不可脩改的，因此嚐試脩改字符串內部數據的操作也是被禁止的：

s[0] = 'L' // compile error: cannot assign to s[0]

不變性意味如果兩個字符串共享相同的底層數據的話也是安全的，這使得複製任何長度的字符串代價是低廉的。同樣，一個字符串s和對應的子字符串切片s[7:]的操作也可以安全地共享相同的內存，因此字符串切片操作代價也是低廉的。在這兩種情況下都沒有必要分配新的內存。圖3.4演示了一個字符串和兩個字串共享相同的底層數據。

{% include "./ch3-05-1.md" %}

{% include "./ch3-05-2.md" %}

{% include "./ch3-05-3.md" %}

{% include "./ch3-05-4.md" %}

{% include "./ch3-05-5.md" %}

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

ch3-05.md

ch3-05.md

3.5. 字符串

Files

ch3-05.md

Latest commit

History

ch3-05.md

File metadata and controls

3.5. 字符串