2019-8-8 seo達(dá)人
如果您想訂閱本博客內(nèi)容,每天自動發(fā)到您的郵箱中, 請點(diǎn)這里
在 C 語言中
1、char a[10] = {"China"} 中,這個 a 占用多少字節(jié)?
答:占用 10 個字節(jié)。
解析:上面代碼對 a 做了賦值的操作,
a[0]='C' ,a[1]='h' ,a[2]='i' ,a[3]='n' ,a[4]='a' ,a[5]='\0',a[6]='\0',a[7]='\0',a[8]='\0',a[9]='\0'
所以,它占用的是 10 個字節(jié)。
2、如果單指 ”China“ ?
答:共 6 個字節(jié)。China 占 5 個字節(jié),最后以 '\0' 結(jié)束,占 1 個字節(jié)。
在 Java 語言中
1、String s = "China"; 占多少字節(jié)?
答:占 5 個字節(jié)。
System.out.println(Charset.defaultCharset());//獲取ide默認(rèn)編碼類型
String s = new String("China".getBytes());
byte[] b = s.getBytes();
System.out.println("" + b.length);
以上代碼,可以輸出 "China" 所占的字節(jié)長度為 5
2、String s = "中國"; 占多少字節(jié)?
答:如果是 漢字 的情況需要考慮編碼。
(1)GBK 編碼(ide默認(rèn))時,每一個漢字占用 2 個字節(jié),那么中國占 4 個字節(jié)。
(2)UTF-8 編碼時,每一個漢字占用 3 個字節(jié),那么中國占用 6 個字節(jié)。
3、轉(zhuǎn)碼問題,GBK 轉(zhuǎn) UTF-8 時,字節(jié)占用會變大嗎?反過來呢?
//獲取的是 UTF-8編碼
System.out.println(Charset.defaultCharset());
String s;
try {
s = new String("中國".getBytes(),"GBK");
byte[] b = s.getBytes();
System.out.println("" + b.length);
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
如上代碼是:UTF-8 轉(zhuǎn) GBK 編碼格式,s 長度從 6 字節(jié)變?yōu)?9 字節(jié)。
s 內(nèi)容變化:中國 —> 涓浗
因?yàn)楫?dāng)前編碼是 UTF-8,轉(zhuǎn)碼之后變成了 3 個文字,占用 9 個字節(jié)。然而,反過來的情況是這樣的:
中國 (gbk) —> ?й? (utf-8)
s 長度從 4字節(jié) 變成了 4字節(jié),雖然長度沒發(fā)生改變,但是文字已經(jīng)改變。這里的 ? 占用 1 個字節(jié)。
藍(lán)藍(lán)設(shè)計(jì)( tweetduck.com )是一家專注而深入的界面設(shè)計(jì)公司,為期望卓越的國內(nèi)外企業(yè)提供卓越的UI界面設(shè)計(jì)、BS界面設(shè)計(jì) 、 cs界面設(shè)計(jì) 、 ipad界面設(shè)計(jì) 、 包裝設(shè)計(jì) 、 圖標(biāo)定制 、 用戶體驗(yàn) 、交互設(shè)計(jì)、 網(wǎng)站建設(shè) 、平面設(shè)計(jì)服務(wù)。
藍(lán)藍(lán)設(shè)計(jì)的小編 http://tweetduck.com