1.3.Алфавіт мови Java. Десяткові і шістнадцяткові цифри і цілі числа. зарезервовані слова
Алфавіт мови Java
Алфавіт мови Java складається з букв, десяткових цифр і спеціальних символів. Літерами вважаються латинські букви (кодуються в стандарті ASCII), букви національних алфавітів (кодуються в стандарті Unicode, кодування UTF-16), а також відповідні їм символи, які кодуються керуючими послідовностями (про них буде розказано трохи пізніше).
Букви і цифри можна використовувати в якості ідентифікаторів (тобто імен) змінних, методів та інших елементів мови програмування. Правда, при використанні в ідентифікаторах національних алфавітів в ряді випадків можуть виникнути проблеми - ці символи будуть показуватися у вигляді знаків питання.
Як літери розглядається тільки частина символів національних алфавітів. Решта символів національних алфавітів - це спеціальні символи. Вони використовуються в якості операторів і роздільників мови Java і не можуть входити до складу ідентифікаторів.
Латинські букви ASCII
Додаткові "букви" ASCII
- _ - знак підкреслення,
- $ - знак долара.
Національні літери на прикладі російського алфавіту
- АБВГ ... ЕЮЯ - заголовні (прописні),
- абвг ... еюя - рядкові
Десяткові і шістнадцяткові цифри і цілі числа
Цілі числові константи в вихідному коді Java (так звані літерні константи) можуть бути десятковими або шестнадцатерічнимі. Вони записуються або символами ASCII, або символами Unicode наступним чином.
Десяткові константи записуються як зазвичай. Наприклад, -137.
Шістнадцяткова константа починається з символів 0x або 0X (цифра 0, після якої слід латинська буква X), а потім йде саме число в шістнадцятковій нотації. Наприклад, 0x10 відповідає; 0x2F відповідає, і т.д. Про шестнадцатеричной нотації розказано трохи нижче.
Раніше іноді застосовувалися восьмеричні числа, і в мовах C / C ++, а також старих версіях Java можна було їх записувати у вигляді числа, який з цифри 0. Тобто 010 означало. В даний час в програмуванні восьмеричні числа практично ніколи не застосовуються, а неадекватне використання провідного нуля може призводити до логічних помилок в програмі.
Ціла константа в звичайній запису має тип int. Якщо після константи додати букву L (або l, що гірше видно в тексті, хоча в середовищі розробки виділяється кольором), вона буде мати тип long. володіє більш широким діапазоном значень, ніж тип int.
Пояснимо тепер, що таке шестнадцатеричная нотація записи чисел і навіщо вона потрібна.
Інформація подається в комп'ютері в двійковому вигляді - як послідовність біт. Біт - це мінімальна порція інформації, він може бути представлений у вигляді осередку, в якій зберігається або нуль, або одиниця. Але біт - занадто дрібна одиниця, тому в комп'ютерах інформація зберігається, кодується і передається байтами - порціями по 8 біт.
Ми звикли працювати з числами, записаними в так званій десятковій системі числення. У ній є 10 цифр (від 0 до 9), а в числі є десяткові розряди. Кожен розряд зліва має вагу 10 в порівнянні з попереднім, тобто для отримання значення числа, відповідного цифрі в якомусь розряді, що стоїть в ньому цифру треба множити на 10 у відповідній мірі. Тобто, і т.п.
У програмуванні десяткової системою числення користуватися не завжди зручно, так як в комп'ютерах інформація організована у вигляді біт, байт і більших порцій. Людині незручно оперувати даними у вигляді довгих послідовностей нулів і одиниць. В даний час в програмуванні стандартною є шестнадцатеричная система запису чисел. Наприклад, з її допомогою природним чином кодується колір, встановлюються значення окремих біт числа, здійснюється шифрування і дешифрування інформації, і так далі. У цій системі числення все дуже схоже на десяткову, але тільки не 10, а 16 цифр, і вага розряду не 10, а 16. Як перші 10 цифр використовуються звичайні десяткові цифри, а в якості відсутніх цифр, великих 9, використовуються великі латинські букви A, B, C, D, E, F:
- 0 1 2 3 4 5 6 7 8 9 A B C D E F
Тобто A = 10, B = 11, C = 12, D = 13, E = 14, F = 15.
Зауважимо, що в шістнадцятковій системі числення числа від 0 до 9 записуються однаково, а перевищують 9 відрізняються. Для чисел від 10 до 15 в шістнадцятковій системі числення використовуються літери від A до F, після чого відбувається використання наступного шістнадцятирічного розряду. Десяткове число 16 в шістнадцятковій системі числення записується як 10. Для того, щоб не плутати числа, записані в різних системах числення. біля них справа пишуть індекс із зазначенням підстави системи числення. Для десяткової системи числення це 10, для шестнадцатеричной 16. Для десяткової системи основа зазвичай не вказують, якщо це не призводить до плутанини. Точно так же в технічній літературі часто не вказують підставу для чисел, записаних в шістнадцятковій системі числення. якщо в запису числа зустрічаються не тільки "звичайні" цифри від 0 до 9, але і "літерні" цифри від A до F. Зазвичай використовують великі літери, але можна застосовувати і малі.
Більш детально питання представлення чисел в комп'ютері будуть розглянуті в окремому розділі.
Зарезервовані слова мови Java
Це слова, зарезервовані для синтаксичних конструкцій мови, причому їх призначення не можна перевизначати всередині програми.
1.4. Керуючі послідовності. Символи Unicode. Спеціальні символи
керуючі послідовності
Керуючі послідовності - символи формування тексту
Іноді в тексті програми в строкових константах потрібно використовувати символи, які звичайним чином в текст програми ввести не можна. Наприклад, символи лапок (їх треба використовувати всередині лапок, що важко), символ питання (зарезервований для тернарного умовного оператора), а також різні спеціальні символи. У цьому випадку використовують керуючу послідовність - символ зворотної косої межі, після якої слід один керуючий символ. У таблиці наведено керуючі послідовності. застосовуються в мові Java.