Иллюстрированный самоучитель по Java


         

Символы


Для записи одиночных символов используются следующие формы.

Печатные символы можно записать в апострофах: '

а

', '

N

', '

?

'.

Управляющие символы записываются в апострофах с обратной наклонной чертой:

'

\n

' — символ перевода строки newline с кодом ASCII 10;

'

\r

' — символ возврата каретки CR с кодом 13;

'

\f

' — символ перевода страницы FF с кодом 12;

'

\b

' — символ возврата на шаг BS с кодом 8;

'

\t

' — символ горизонтальной табуляции НТ с кодом 9;

'

\\

' — обратная наклонная черта;

'

\"

' — кавычка;

'

\'

' — апостроф.

Код любого символа с десятичной кодировкой от 0 до 255 можно задать, записав его не более чем тремя цифрами в восьмеричной системе счисления в апострофах после обратной наклонной черты: '

\123

' — буква

S

, '

\346

' — буква

Ж

в кодировке СР1251. Не рекомендуется использовать эту форму записи для печатных и управляющих символов, перечисленных в предыдущем пункте, поскольку компилятор сразу же переведет восьмеричную запись в указанную выше форму. Наибольший код '

\377

' — десятичное число 255.

Код любого символа в кодировке Unicode набирается в апострофах после обратной наклонной черты и латинской буквы ц ровно четырьмя шестнад-цатеричными цифрами: '

\u0053

' — буква

S

, '

\u0416

' — буква

Ж

.

Символы хранятся в формате типа

char

(см. ниже).

Примечание

Прописные русские буквы в кодировке Unicode занимают диапазон от '

\u0410

' — заглавная буква

А

, до '

\u042F

' — заглавная

Я

, строчные буквы от '

\u0430

' —

а

, до '

\044F

' —

я

.

В какой бы форме ни записывались символы, компилятор переводит их в Unicode, включая и исходный текст программы.

Замечание

Компилятор и исполняющая система Java работают только с кодировкой Unicode.



Содержание  Назад  Вперед