Символы
Для записи одиночных символов используются следующие формы.
Печатные символы можно записать в апострофах: '
а
', '
N
', '
?
'.
Управляющие символы записываются в апострофах с обратной наклонной чертой:
'
\n
' — символ перевода строки newline с кодом ASCII 10;
'
\r
' — символ возврата каретки CR с кодом 13;
'
\f
' — символ перевода страницы FF с кодом 12;
'
\b
' — символ возврата на шаг BS с кодом 8;
'
\t
' — символ горизонтальной табуляции НТ с кодом 9;
'
\\
' — обратная наклонная черта;
'
\"
' — кавычка;
'
\'
' — апостроф.
Код любого символа с десятичной кодировкой от 0 до 255 можно задать, записав его не более чем тремя цифрами в восьмеричной системе счисления в апострофах после обратной наклонной черты: '
\123
' — буква
S
, '
\346
' — буква
Ж
в кодировке СР1251. Не рекомендуется использовать эту форму записи для печатных и управляющих символов, перечисленных в предыдущем пункте, поскольку компилятор сразу же переведет восьмеричную запись в указанную выше форму. Наибольший код '
\377
' — десятичное число 255.
Код любого символа в кодировке Unicode набирается в апострофах после обратной наклонной черты и латинской буквы ц ровно четырьмя шестнад-цатеричными цифрами: '
\u0053
' — буква
S
, '
\u0416
' — буква
Ж
.
Символы хранятся в формате типа
char
(см. ниже).
Примечание
Прописные русские буквы в кодировке Unicode занимают диапазон от '
\u0410
' — заглавная буква
А
, до '
\u042F
' — заглавная
Я
, строчные буквы от '
\u0430
' —
а
, до '
\044F
' —
я
.
В какой бы форме ни записывались символы, компилятор переводит их в Unicode, включая и исходный текст программы.
Замечание
Компилятор и исполняющая система Java работают только с кодировкой Unicode.