Дешифриране на двоичен код онлайн. Двоичен код

Двоичният код представлява текст, инструкции на компютърния процесор или други данни, използвайки произволна двусимволна система. Най-често това е система от 0 и 1, която присвоява модел от двоични цифри (битове) на всеки символ и инструкция. Например, двоичен низ от осем бита може да представлява всяка от 256 възможни стойности и следователно може да генерира много различни елементи. Прегледите на двоичния код от световната професионална общност на програмистите показват, че това е основата на професията и основният закон на функционирането на компютърните системи и електронните устройства.

Дешифриране на двоичния код

В компютрите и телекомуникациите двоичните кодове се използват за различни методи за кодиране на знаци за данни в битови низове. Тези методи могат да използват низове с фиксирана или променлива ширина. Има много набори от символи и кодировки за конвертиране в двоичен код. В код с фиксирана ширина всяка буква, цифра или друг знак се представя от битов низ със същата дължина. Този битов низ, интерпретиран като двоично число, обикновено се показва в кодови таблици в осмична, десетична или шестнадесетична система.

Двоично декодиране: битов низ, интерпретиран като двоично число, може да бъде преобразуван в десетично число. Например малката буква a, ако е представена от битовия низ 01100001 (както в стандартния ASCII код), може също да бъде представена като десетично число 97. Преобразуването на двоичен код в текст е същата процедура, само в обратен ред.

Как работи

От какво се състои двоичният код? Кодът, използван в цифровите компютри, се основава на това, че има само две възможни състояния: включено. и изключено, обикновено означавано с нула и едно. Докато в десетичната система, която използва 10 цифри, всяка позиция е кратна на 10 (100, 1000 и т.н.), в двоичната система всяка позиция на цифрата е кратна на 2 (4, 8, 16 и т.н.) . Сигналът с двоичен код е поредица от електрически импулси, които представляват числа, символи и операции, които трябва да бъдат извършени.

Устройство, наречено часовник, изпраща регулярни импулси и компоненти като транзистори се включват (1) или изключват (0), за да предават или блокират импулсите. В двоичния код всяко десетично число (0-9) е представено от набор от четири двоични цифри или бита. Четирите основни операции на аритметиката (събиране, изваждане, умножение и деление) могат да бъдат сведени до комбинации от фундаментални булеви алгебрични операции върху двоични числа.

Битът в теорията на комуникацията и информацията е единица данни, еквивалентна на резултата от избор между две възможни алтернативи в двоичната бройна система, често използвана в цифровите компютри.

Прегледи на двоичен код

Природата на кода и данните е основна част от фундаменталния свят на ИТ. Този инструмент се използва от специалисти от глобалното ИТ „зад кулисите“ - програмисти, чиято специализация е скрита от вниманието на обикновения потребител. Прегледите на двоичния код от разработчиците показват, че тази област изисква задълбочено изучаване на математическите основи и обширна практика в областта на математическия анализ и програмиране.

Двоичният код е най-простата форма на компютърен код или програмни данни. Представен е изцяло от двоична цифрова система. Според прегледите на двоичния код, той често се свързва с машинен код, тъй като двоичните набори могат да бъдат комбинирани, за да образуват изходен код, който се интерпретира от компютър или друг хардуер. Това е отчасти вярно. използва набори от двоични цифри за формиране на инструкции.

Заедно с най-основната форма на код, двоичният файл представлява и най-малкото количество данни, което преминава през всички сложни хардуерни и софтуерни системи от край до край, които обработват днешните ресурси и активи от данни. Най-малкото количество данни се нарича бит. Текущите низове от битове стават код или данни, които се интерпретират от компютъра.

Двоично число

В математиката и цифровата електроника двоичното число е число, изразено в числова система с основа 2 или двоична числова система, която използва само два знака: 0 (нула) и 1 (едно).

Бройната система с основа 2 е позиционен запис с радиус 2. Всяка цифра се нарича бит. Поради простата си реализация в цифрови електронни схеми, използващи логически правила, двоичната система се използва от почти всички съвременни компютри и електронни устройства.

История

Съвременната двоична бройна система като основа за двоичен код е изобретена от Готфрид Лайбниц през 1679 г. и е представена в неговата статия „Обяснена двоичната аритметика“. Двоичните числа са централни за теологията на Лайбниц. Той вярваше, че двоичните числа символизират християнската идея за творчество ex nihilo или създаване от нищо. Лайбниц се опита да намери система, която да трансформира вербалните логически твърдения в чисто математически данни.

Двоичните системи, предхождащи Лайбниц, също са съществували в древния свят. Пример за това е китайската двоична система И Дзин, където текстът за гадаене се основава на двойствеността на ин и ян. В Азия и Африка барабани с прорези с бинарни тонове са били използвани за кодиране на съобщения. Индийският учен Пингала (около 5 век пр. н. е.) разработи двоична система, за да опише прозодията в своя труд Чандашутрема.

Жителите на остров Мангарева във Френска Полинезия са използвали хибридна двоично-десетична система до 1450 г. През 11-ти век ученият и философ Шао Йонг разработи метод за организиране на хексаграми, който съответства на последователността от 0 до 63, както е представена в двоичен формат, като ин е 0, а ян е 1. Редът също е лексикографски ред в блокове от елементи, избрани от набор от два елемента.

Ново време

През 1605 г. обсъжда система, в която буквите от азбуката могат да бъдат редуцирани до последователности от двоични цифри, които след това могат да бъдат кодирани като фини вариации на типа във всеки произволен текст. Важно е да се отбележи, че Франсис Бейкън е този, който допълва общата теория на двоичното кодиране с наблюдението, че този метод може да се използва с всякакви обекти.

Друг математик и философ на име Джордж Бул публикува статия през 1847 г., наречена „Математически анализ на логиката“, която описва алгебричната система на логиката, известна днес като булева алгебра. Системата се основава на двоичен подход, който се състои от три основни операции: И, ИЛИ и НЕ. Тази система не заработи, докато студент от MIT на име Клод Шанън не забеляза, че булевата алгебра, която изучаваше, беше подобна на електрическа верига.

Шанън написва дисертация през 1937 г., която прави важни открития. Тезата на Шанън стана отправна точка за използването на двоичен код в практически приложения като компютри и електрически вериги.

Други форми на двоичен код

Bitstring не е единственият тип двоичен код. Двоична система като цяло е всяка система, която позволява само две опции, като например превключване в електронна система или прост верен или неверен тест.

Брайловото писмо е вид двоичен код, широко използван от незрящи хора за четене и писане чрез докосване, кръстен на своя създател Луис Брайл. Тази система се състои от решетки от по шест точки, по три на колона, в които всяка точка има две състояния: повдигната или вдлъбната. Различни комбинации от точки могат да представляват всички букви, цифри и препинателни знаци.

Американският стандартен код за обмен на информация (ASCII) използва 7-битов двоичен код за представяне на текст и други знаци в компютри, комуникационно оборудване и други устройства. На всяка буква или символ се присвоява номер от 0 до 127.

Двоично кодиран десетичен или BCD е двоично кодирано представяне на цели числа, което използва 4-битова графика за кодиране на десетични цифри. Четири двоични бита могат да кодират до 16 различни стойности.

В BCD-кодираните числа само първите десет стойности във всяка хапка са валидни и кодират десетичните цифри с нули след деветките. Останалите шест стойности са невалидни и могат да причинят или изключение на машината, или неопределено поведение, в зависимост от внедряването на BCD аритметика на компютъра.

BCD аритметиката понякога се предпочита пред числовите формати с плаваща запетая в търговски и финансови приложения, където поведението при закръгляване на сложни числа е нежелателно.

Приложение

Повечето съвременни компютри използват програма с двоичен код за инструкции и данни. CD, DVD и Blu-ray дискове представят аудио и видео в двоична форма. Телефонните разговори се извършват цифрово в междуселищни и мобилни телефонни мрежи, като се използва импулсна кодова модулация и в мрежи за глас през IP.

Нека да разберем как става всичко конвертиране на текстове в цифров код? Между другото, на нашия уебсайт можете да конвертирате всеки текст в десетичен, шестнадесетичен, двоичен код с помощта на онлайн калкулатора на кодове.

Кодиране на текст.

Според компютърната теория всеки текст се състои от отделни знаци. Тези знаци включват: букви, цифри, малки препинателни знаци, специални знаци (“”, №, () и т.н.), те също включват интервали между думите.

Необходима база от знания. Наборът от символи, с които пиша текст, се нарича АЗБУКА.

Броят на символите, взети в една азбука, представлява нейната сила.

Количеството информация може да се определи по формулата: N = 2b

  • N е същата мощност (много символи),
  • b - Бит (тегло на взетия символ).

Азбука, съдържаща 256, може да съдържа почти всички необходими знаци. Такива азбуки се наричат ​​ДОСТАТЪЧНИ.

Ако вземем азбука с капацитет 256 и имайте предвид, че 256 = 28

  • 8 бита винаги се наричат ​​1 байт:
  • 1 байт = 8 бита.

Ако преобразувате всеки знак в двоичен код, тогава този компютърен текстов код ще заема 1 байт.

Как може да изглежда текстовата информация в компютърната памет?

Всеки текст се въвежда на клавиатурата, на клавишите на клавиатурата виждаме познатите ни знаци (цифри, букви и др.). Те влизат в оперативната памет на компютъра само под формата на двоичен код. Двоичният код за всеки знак изглежда като осемцифрено число, например 00111111.

Тъй като байтът е най-малката адресируема част от паметта и паметта се адресира към всеки знак поотделно, удобството на такова кодиране е очевидно. Въпреки това, 256 символа е много удобно количество за всяка символна информация.

Естествено възникна въпросът Кое конкретно? осемцифрен кодпринадлежи на всеки герой? И как да конвертирате текст в цифров код?

Този процес е условен и ние имаме право да измислим различни начини за кодиране на символи. Всеки знак от азбуката има свой собствен номер от 0 до 255. И на всеки номер е присвоен код от 00000000 до 11111111.

Таблицата за кодиране е „мамски лист“, в който знаците на азбуката са посочени в съответствие със серийния номер. Различните типове компютри използват различни таблици за кодиране.

ASCII (или Asci) се превърна в международен стандарт за персонални компютри. Масата има две части.

Първата половина е за ASCII таблицата. (Това беше първото полувреме, което се превърна в стандарт.)

Спазването на лексикографския ред, т.е. в таблицата буквите (малки и главни) са посочени в строг азбучен ред, а числата са във възходящ ред, се нарича принцип на последователно кодиране на азбуката.

За руската азбука те също следват принцип на последователно кодиране.

Сега, в наше време, те използват цели пет системи за кодиранеРуска азбука (KOI8-R, Windows. MS-DOS, Macintosh и ISO). Поради броя на системите за кодиране и липсата на един стандарт, много често възникват недоразумения при прехвърлянето на руски текст в неговата компютърна форма.

Един от първите стандарти за кодиране на руската азбукаа на персонални компютри те считат KOI8 („Код за обмен на информация, 8 бита“). Това кодиране е използвано в средата на седемдесетте години на серия компютри ES, а от средата на осемдесетте години започва да се използва в първите операционни системи UNIX, преведени на руски език.

От началото на деветдесетте години, така нареченото време, когато доминираше операционната система MS DOS, се появи системата за кодиране CP866 ("CP" означава "Кодова страница").

Гигантските компютърни компании APPLE, с тяхната иновативна система, под която са работили (Mac OS), започват да използват собствена система за кодиране на MAC азбуката.

Международната организация по стандартизация (ISO) определя друг стандарт за руския език азбучна система за кодиране, който се нарича ISO 8859-5.

И най-разпространената система за кодиране на азбуката в наши дни е изобретена в Microsoft Windows и се нарича CP1251.

От втората половина на 90-те години проблемът със стандарта за превод на текст в цифров код за руски език и не само беше решен чрез въвеждане на система, наречена Unicode, в стандарта. Той е представен от шестнадесет-битово кодиране, което означава, че точно два байта RAM са разпределени за всеки знак. Разбира се, с това кодиране разходите за памет се удвояват. Въпреки това, такава кодова система позволява до 65 536 знака да бъдат преобразувани в електронен код.

Спецификата на стандартната система Unicode е включването на абсолютно всяка азбука, била тя съществуваща, изчезнала или изобретена. В крайна сметка, абсолютно всяка азбука, в допълнение към това системата Unicode включва много математически, химически, музикални и общи символи.

Нека използваме ASCII таблица, за да видим как може да изглежда една дума в паметта на вашия компютър.

Често се случва вашият текст, който е написан с букви от руската азбука, да не се чете, това се дължи на разликите в системите за кодиране на азбуката на компютрите. Това е много често срещан проблем, който се среща доста често.

Всички знаци и букви могат да бъдат кодирани с помощта на осем двоични бита. Най-често срещаните таблици с двоични знаци са ASCII и ANSI, които могат да се използват за писане на текст в микропроцесори. В ASCII и ANSI таблиците първите 128 знака са еднакви. Тази част от таблицата съдържа кодове за цифри, препинателни знаци, главни и малки латински букви и контролни знаци. Националните разширения на символните таблици и псевдографичните символи се съдържат в последните 128 кода на тези таблици, поради което руските текстове в операционните системи DOS и WINDOWS не съвпадат.

При първото запознаване с компютри и микропроцесори може да възникне въпросът - „как да конвертирате текст в двоичен код?“ Тази трансформация обаче е най-простото действие! За да направите това, трябва да използвате всеки текстов редактор. Най-простата програма Notepad, включена в операционната система Windows, също е подходяща. Подобни редактори присъстват във всички програмни среди за езици като SI, Pascal или Java. Трябва да се отбележи, че най-разпространеният текстов редактор, Word, не е подходящ за обикновено преобразуване на текст в двоичен код. Този тестов редактор въвежда огромно количество допълнителна информация, като цвят на буквите, курсив, подчертаване, език, на който е написана определена фраза и шрифт.

Трябва да се отбележи, че всъщност комбинацията от нули и единици, с които е кодирана текстовата информация, не е двоичен код, т.к. битовете в този код не се подчиняват на законите. Въпреки това, в интернет фразата за търсене „двоично представяне на букви“ е най-често срещаната. Таблица 1 показва съответствието на двоичните кодове с буквите от латинската азбука. За краткост последователността от нули и единици в тази таблица е представена в десетични и шестнадесетични кодове.

маса 1Таблица за представяне на латински букви в двоичен код (ASCII)

Десетичен код Шестнадесетичен код Символ на дисплея Значение
0 00 NUL
1 01 (показва контролна дума)
2 02 (Първата предадена дума)
3 03 ETX (последна дума на предаване)
4 04 EOT (край на предаването)
5 05 ENQ (инициализация)
6 06 ACK (потвърждение)
7 07 БЕЛ
8 08 Б.С.
9 09 HT (хоризонтален раздел)
10 LF (подаване на ред)
11 VT (вертикален раздел)
12 FF (следваща страница)
13 0D CR (връщане на каретка)
14 0E SO (двойна ширина)
15 0F SI (твърдо уплътнение)
16 10 DLE
17 11 DC1
18 12 DC2 (компактен печат Cancel)
19 13 DC3 (готов)
20 14 DC4 (отмяна с двойна ширина)
21 15 § NAC (без потвърждение)
22 16 SYN
23 17 ETB
24 18 МОГА
25 19 Е.М.
26 ПОДП
27 ESC (начало на контролната последователност)
28 1C FS
29 1D Г.С.
30 1E Р.С.
31 1F НАС
32 20 пространство
33 21 ! Удивителен знак
34 22 « Ъглова скоба
35 23 # Знак за число
36 24 $ Знак за валута (долар)
37 25 % Знак за процент
38 26 & амперсанд
39 27 " апостроф
40 28 ( Отваряща скоба
41 29 ) Затваряща скоба
42 * звезда
43 2B + Знак плюс
44 2C , Запетая
45 2D - Знак минус
46 2E . Точка
47 2F / Дробна лента
48 30 0 Цифра нула
49 31 1 Номер едно
50 32 2 Номер две
51 33 3 Номер три
52 34 4 Номер четири
53 35 5 Номер пет
54 36 6 Номер шест
55 37 7 Номер седем
56 38 8 Номер осем
57 39 9 Номер девет
58 : Дебело черво
59 3B ; точка и запетая
60 3C < Знак по-малко
61 3D = Знак за равенство
62 3E > Още знак
63 3F ? Въпросителен знак
64 40 @ Търговски етаж
65 41 А Главна латинска буква А
66 42 б Главна латинска буква B
67 43 ° С Главна латинска буква C
68 44 д Главна латинска буква D
69 45 д Главна латинска буква E
70 46 Е Главна латинска буква F
71 47 Ж Главна латинска буква G
72 48 з Главна латинска буква H
73 49 аз Главна латинска буква I
74 Дж Главна латинска буква J
75 4B К Главна латинска буква K
76 4C Л Главна латинска буква L
77 4D М Главна латинска буква
78 4E н Главна латинска буква N
79 4F О Главна латинска буква О
80 50 П Главна латинска буква P
81 51 Q Главна латинска буква
82 52 Р Главна латинска буква R
83 53 С Главна латинска буква S
84 54 T Главна латинска буква Т
85 55 U Главна латинска буква U
86 56 V Главна латинска буква V
87 57 У Главна латинска буква W
88 58 х Главна латинска буква X
89 59 Y Главна латинска буква Y
90 З Главна латинска буква Z
91 5B [ Отваряща квадратна скоба
92 5C \ Наклонена черта
93 5 Д ] Затваряща квадратна скоба
94 5E ^ "капак"
95 5 _ Долна черта
96 60 ` апостроф
97 61 а малка латинска буква a
98 62 b малка латинска буква b
99 63 ° С малка латинска буква c
100 64 д малка латинска буква d
101 65 д малка латинска буква e
102 66 f малка латинска буква f
103 67 ж малка латинска буква g
104 68 ч малка латинска буква h
105 69 аз малка латинска буква i
106 й малка латинска буква j
107 6B к малка латинска буква k
108 6C л малка латинска буква l
109 6D м малка латинска буква m
110 6E н малка латинска буква n
111 6F о малка латинска буква o
112 70 стр малка латинска буква p
113 71 р малка латинска буква q
114 72 r малка латинска буква r
115 73 с малка латинска буква s
116 74 T малка латинска буква t
117 75 u малка латинска буква u
118 76 v латинска малка буква v
119 77 w малка латинска буква w
120 78 х латинска малка буква x
121 79 г малка латинска буква у
122 z малка латинска буква z
123 7B { Отваряща скоба
124 7C | Вертикална лента
125 7D } Затваряща скоба
126 7E ~ Тилда
127 7F

В класическата версия на таблицата със символи ASCII няма руски букви и се състои от 7 бита. По-късно обаче тази таблица беше разширена до 8 бита и в горните 128 реда се появиха руски букви в двоичен код и псевдографски символи. Като цяло втората част съдържа националните азбуки на различни страни и руските букви са само един от възможните набори (855); може да има френска (863), немска (1141) или гръцка (737) таблица. Таблица 2 показва пример за представяне на руски букви в двоичен код.

Таблица 2.Таблица за представяне на руски букви в двоичен код (ASCII)

Десетичен код Шестнадесетичен код Символ на дисплея Значение
128 80 А Главна руска буква А
129 81 б Главна руска буква Б
130 82 IN Главна руска буква Б
131 83 Ж Главна руска буква Г
132 84 д Главна руска буква Д
133 85 д Главна руска буква Е
134 86 И Главна руска буква Ж
135 87 З Главна руска буква Z
136 88 И Главна руска буква I
137 89 Y Главна руска буква Y
138 ДА СЕ Главна руска буква К
139 8B Л Главна руска буква Л
140 8C М Главна руска буква М
141 8D н Главна руска буква Н
142 8E ОТНОСНО Главна руска буква О
143 8F П Главна руска буква П
144 90 Р Главна руска буква Р
145 91 СЪС Главна руска буква С
146 92 T Главна руска буква Т
147 93 U Главна руска буква U
148 94 Е Главна руска буква Ф
149 95 х Главна руска буква X
150 96 ° С Главна руска буква Т
151 97 з Главна руска буква CH
152 98 Ш Главна руска буква Ш
153 99 SCH Главна руска буква Ш
154 Комерсант Главна руска буква Ъ
155 9B Y Главна руска буква Y
156 9C b Главна руска буква б
157 9D д Главна руска буква Е
158 9E Ю Главна руска буква Ю
159 9F аз Главна руска буква I
160 A0 А Малка руска буква а
161 A1 b Малка руска буква б
162 A2 V Руска малка буква v
163 A3 Ж Малка руска буква ж
164 A4 д Малка руска буква d
165 A5 д Малка руска буква е
166 A6 и Малка руска буква з
167 A7 ч Малка руска буква з
168 A8 И Малка руска буква и
169 A9 th Малка руска буква th
170 А.А. Да се Руска малка буква к
171 AB л Малка руска буква л
172 A.C. м Малка руска буква м
173 AD н Малка руска буква n
174 А.Е. О Руска малка буква о
175 А.Ф. П Малка руска буква п
176 B0
177 B1
178 B2
179 B3 Псевдографски символ
180 B4 Псевдографски символ
181 B5 Псевдографски символ
182 B6 Псевдографски символ
183 B7 Псевдографски символ
184 B8 Псевдографски символ
185 B9 Псевдографски символ
186 Б.А. Псевдографски символ
187 BB Псевдографски символ
188 пр.н.е. Псевдографски символ
189 BD Псевдографски символ
190 БЪДА Псевдографски символ
191 Б.Ф. Псевдографски символ
192 C0 Псевдографски символ
193 C1 Псевдографски символ
194 C2 Псевдографски символ
195 C3 Псевдографски символ
196 C4 Псевдографски символ
197 C5 Псевдографски символ
198 C6 Псевдографски символ
199 C7 Псевдографски символ
200 C8 Псевдографски символ
201 C9 Псевдографски символ
202 C.A. Псевдографски символ
203 C.B. Псевдографски символ
204 CC Псевдографски символ
205 CD Псевдографски символ
206 н.е. Псевдографски символ
207 CF Псевдографски символ
208 D0 Псевдографски символ
209 D1 Псевдографски символ
210 D2 Псевдографски символ
211 D3 Псевдографски символ
212 D4 Псевдографски символ
213 D5 Псевдографски символ
214 D6 Псевдографски символ
215 D7 Псевдографски символ
216 D8 Псевдографски символ
217 D9 Псевдографски символ
218 Д.А. Псевдографски символ
219 Д.Б.
220 DC
221 DD
222 DE
223 DF
224 E0 Р Малка руска буква р
225 E1 с Руска малка буква s
226 E2 T Малка руска буква т
227 E3 при Руска малка буква u
228 E4 f Малка руска буква ф
229 E5 х Руска малка буква х
230 E6 ц Малка руска буква c
231 E7 ч Малка руска буква ч
232 E8 w Малка руска буква ш
233 E9 sch Руска малка буква ш
234 Е.А. ъ Малка руска буква ъ
235 Е.Б. с Малка руска буква ы
236 E.C. b Малка руска буква ь
237 ЕД ъъъ Малка руска буква е
238 Е.Е. Ю Малка руска буква ю
239 Е.Ф. аз Малка руска буква i
240 F0 Йо Главна руска буква Йо
241 F1 д Малка руска буква ё
242 F2 Є
243 F3 є
244 F4 Ї
245 F5 Ї
246 F6 Ў
247 F7 ў
248 F8 ° Знак за степен
249 F9 Знак за умножение (точка)
250 F.A. ·
251 FB Радикал (вземане на корен)
252 F.C. Знак за число
253 FD ¤ Валутен знак (рубла)
254 F.E.
255 FF

При писане на текстове, в допълнение към двоичните кодове, които директно показват букви, се използват кодове, които показват прехода към нов ред и връщането на курсора (връщане на каретката) към нулевата позиция на реда. Тези символи обикновено се използват заедно. Техните двоични кодове съответстват на десетичните числа - 10 (0A) и 13 (0D). Като пример, по-долу е част от текста на тази страница (изхвърляне на паметта). Първият му параграф е написан в този раздел. Следният формат се използва за показване на информация в дъмп на паметта:

  • първата колона съдържа двоичния адрес на първия байт на реда
  • Следващите шестнадесет колони съдържат байтовете, съдържащи се в текстовия файл. За по-удобно определяне на номера на байта след осмата колона се изчертава вертикална линия. Байтовете, за краткост, са представени в шестнадесетичен код.
  • в последната колона същите тези байтове са представени като показваеми азбучни знаци
00000000: 82 E1 A5 20 E1 A8 AC A2 ¦ AE AB EB 20 A8 20 A1 E3 Всички символи и 00000010: AA A2 EB 20 AC AE A3 E3 ¦ E2 20 A1 EB E2 EC 20 A7 коефициентите могат да бъдат 3 00000020: A0 AA AE A4 A8 E0 AE A2 ¦ A0 AD EB 20 AF E0 A8 20 кодиран в 00000030: AF AE AC AE E9 A8 20 A2 ¦ AE E1 EC AC A8 20 A4 A2 помощ при осем врати 00000040: AE A8 E7 AD EB E5 20 E1 ¦ A8 AC A2 AE AB AE A2 2E основни знаци. 00000050: 0D 0A 8D A0 A8 A1 AE AB ¦ A5 A5 20 E0 A0 E1 AF E0 ♪◙Най-често 00000060: AE E1 E2 E0 A0 AD A5 AD ¦ AD EB AC A8 20 E2 A0 A1 странен раздел 00000070: AB A8 E6 A0 AC A8 20 EF ¦ A2 AB EF EE E2 E1 EF 20 души са 00000080: E2 A0 A1 AB A8 E6 EB 20 ¦ 41 53 43 49 49 20 E1 20 ASCII таблици с 00000090: AD A0 E6 A8 AE AD A0 AB ¦ EC AD EB AC A8 0D 0A E0 национален♪◙р 000000A0: A0 E1 E8 A8 E0 A5 AD A8 ¦ EF AC A8 2C 20 AF E0 A8 разширения, при 000000B0: AC A5 AD EF EE E9 A8 A5 ¦ E1 EF 20 A2 20 44 4F 53 промяна в DOS 000000C0: 20 28 A8 20 AA AE E2 AE ¦ E0 EB A5 20 AC AE A6 AD (и който може да се използва 000000D0: AE 20 A8 E1 AF AE AB EC ¦ A7 AE A2 A0 E2 EC 20 A4 или да използвате d 000000E0 : AB EF 20 A7 A0 AF A8 E1 ¦ A8 0D 0A E2 A5 AA E1 E2 за запис♪◙текст 000000F0: AE A2 20 A2 20 AC A8 AA ¦ E0 AE AF E0 AE E6 A5 E1 ov в микропроцес 00000100: E1 AE E0 A0 E5 29 2C 20 ¦ A8 20 E2 A0 A1 AB A8 E6 sorah), и таблици 00000110: EB 20 41 4E 53 49 2C 20 ¦ AF E0 A8 AC A5 AD EF EE s ANSI, използвам 00000120: E9 A8 A5 E1 EF 20 A2 20 ¦ 57 49 4E 44 4F 57 53 2E налични в WINDOWS. 00000130: 20 82 20 E2 A0 A1 AB A8 ¦ E6 A0 E5 0D 0A 41 53 43 В таблици♪◙ASC 00000140: 49 49 20 A8 20 41 4E 53 ¦ 49 20 AF A5 E0 A2 EB A5 II и първо ANSI 0 0000150: 20 31 32 38 20 E1 A8 AC ¦ A2 AE AB AE A2 20 E1 AE 128 знака с 00000160: A2 AF A0 A4 A0 EE E2 2E ¦ 20 82 20 ED E2 AE A9 20 падане. В тази 00000170: E7 A0 E1 E2 A8 20 E2 A0 ¦ A1 AB A8 E6 EB 20 E1 AE част от таблицата с 00000180: A4 A5 E0 A6 A0 E2 E1 EF ¦ 0D 0A E1 A8 AC A2 AE AB се съхранява♪◙знак 00000190: EB 20 E6 A8 E4 E0 2C 20 ¦ A7 AD A0 AA AE A2 20 AF числа, знаци p 000001A0: E0 A5 AF A8 AD A0 AD A8 ¦ EF 2C 20 AB A0 E2 A8 AD повторение, латиница 000001B0: E1 AA A8 A5 20 A1 E3 AA A2 EB 20 A2 A5 E0 E5 AD 0A E3 AF E0 A0 A2 главни и ♪◙контролери 000001E0: AB EF EE E9 A8 A5 20 E1 ¦ A8 AC A2 AE AB EB 2E 20 кастинг знака. 000001F0: 8D A0 E6 A8 AE AD A0 AB ¦ EC AD EB A5 20 E0 A0 E1 Национални състезания 00000200: E8 A8 E0 A5 AD A8 EF 20 ¦ E1 A8 AC A2 AE AB EC AD символ за разширение 00000210: EB E5 20 E2 A0 A1 AB A8 ¦ E6 20 A8 20 E1 A8 AC A2 таблици и символи 00000220: AE AB EB 0D 0A AF E1 A5 ¦ A2 A4 AE A3 E0 A0 E4 A8 псевдографи 00000230: AA A8 20 E1 AE A4 A5 E0 ¦ A6 A 0 E2 E1 EF 20 A2 20 ki се съдържат в 00000240: AF AE E1 AB A5 A4 AD A8 ¦ E5 20 31 32 38 20 AA AE последните 128 kos 00000250: A4 A0 E5 20 ED E2 A8 E5 ¦ 20 E2 A0 A1 AB A8 E6 2C DAX от тези таблици, 00000260: 20 AF AE E2 AE AC E3 ¦ 20 E0 E1 E1 AA A8 Следователно руснаци 00000270: 0A E2 AA E1 EB ¦ 20 A2 20 AE AF A5 E0 ♪ ◙ Текстове в Opera 00000280 : E6 A8 AE AD AD EB E5 20 ¦ E1 A8 E1 E2 A5 AC A0 E5 tion systems 00000290: 20 44 4F 53 20 A8 20 57 ¦ 49 4E 44 4F 57 53 20 AD DOS и WINDOWS n 000002A0: A5 20 E1 AE A2 AF A0 A4 ¦ A 0 EE E2 2E 0D 0A e съвпадат. ♪◙

В примера по-горе можете да видите, че първият ред текст заема 80 байта. Първият байт 82 съответства на буквата "B". Вторият байт E1 съответства на буквата "c". Третият байт A5 съответства на буквата "e". Следващият байт 20 показва празното пространство между думите (интервал) " ". Байтове 81 и 82 съдържат символи за връщане на каретка и за подаване на ред 0D 0A. Намираме тези знаци на двоичния адрес 00000050: Следващият ред от изходния текст не е кратен на 16 (дължината му е 76 букви), така че, за да намерим края му, първо ще трябва да намерим реда 000000E0: и да преброим девет колони от него. Там отново се записват байтовете за връщане на каретката и за подаване на ред 0D 0A. Останалата част от текста се анализира по абсолютно същия начин.

Дата на последна актуализация на файла: 12/04/2018

Литература:

Заедно със статията „Писане на текстове в двоичен код“ прочетете:

Представяне на двоични числа в паметта на компютър или микроконтролер
http://site/proc/IntCod.php

Понякога е удобно да съхранявате числа в паметта на процесора в десетична форма
http://site/proc/DecCod.php

Стандартни формати на числа с плаваща запетая за компютри и микроконтролери
http://site/proc/float/

Понастоящем както позиционните, така и непозиционните числови системи се използват широко както в технологиите, така и в ежедневието.
.php

Наборът от знаци, с които е написан текстът, се нарича азбука.

Броят на знаците в азбуката е негов мощност.

Формула за определяне на количеството информация: N=2b,

където N е степента на азбуката (брой знаци),

b – брой битове (информационно тегло на символа).

Азбуката, с капацитет от 256 знака, може да побере почти всички необходими знаци. Тази азбука се нарича достатъчно.

защото 256 = 2 8, тогава теглото на 1 символ е 8 бита.

Мерната единица 8 бита получи името 1 байт:

1 байт = 8 бита.

Двоичният код на всеки знак в компютърния текст заема 1 байт памет.

Как се представя текстовата информация в компютърната памет?

Удобството на кодирането на знаци байт по байт е очевидно, тъй като байтът е най-малката адресируема част от паметта и следователно процесорът може да има достъп до всеки знак поотделно, когато обработва текст. От друга страна, 256 знака са напълно достатъчен брой за представяне на голямо разнообразие от символична информация.

Сега възниква въпросът кой осембитов двоичен код да присвоите на всеки знак.

Ясно е, че това е условен въпрос, можете да измислите много методи за кодиране.

Всички символи на компютърната азбука са номерирани от 0 до 255. Всяко число съответства на осембитов двоичен код от 00000000 до 11111111. Този код е просто поредният номер на знака в двоичната бройна система.

Таблица, в която на всички символи от компютърната азбука са присвоени серийни номера, се нарича таблица за кодиране.

Различните типове компютри използват различни таблици за кодиране.

Таблицата се превърна в международен стандарт за компютри ASCII(четете aski) (Американски стандартен код за обмен на информация).

ASCII кодовата таблица е разделена на две части.

Само първата половина на таблицата е международният стандарт, т.е. символи с числа от 0 (00000000), до 127 (01111111).

Структура на ASCII кодираща таблица

Сериен номер

Код

Символ

0 - 31

00000000 - 00011111

Символи с числа от 0 до 31 обикновено се наричат ​​контролни символи.
Тяхната функция е да контролират процеса на показване на текст на екрана или печат, подаване на звуков сигнал, маркиране на текст и др.

32 - 127

00100000 - 01111111

Стандартна част от масата (английски). Това включва малки и главни букви от латинската азбука, десетични числа, препинателни знаци, всички видове скоби, търговски и други символи.
Знак 32 е интервал, т.е. празна позиция в текста.
Всички останали се отразяват с определени знаци.

128 - 255

10000000 - 11111111

Алтернативна част на таблицата (руски).
Втората половина на ASCII кодовата таблица, наречена кодова страница (128 кода, започващи от 10000000 и завършващи с 11111111), може да има различни опции, като всяка опция има свой номер.
Кодовата страница се използва предимно за настаняване на национални азбуки, различни от латиница. В руските национални кодировки знаците от руската азбука се поставят в тази част на таблицата.

Първата половина на ASCII кодовата таблица


Моля, обърнете внимание, че в таблицата за кодиране буквите (главни и малки) са подредени по азбучен ред, а числата са подредени във възходящ ред. Това спазване на лексикографски ред в подреждането на символите се нарича принцип на последователно кодиране на азбуката.

За буквите от руската азбука също се спазва принципът на последователно кодиране.

Втората половина на ASCII кодовата таблица


За съжаление в момента има пет различни кодировки на кирилица (KOI8-R, Windows. MS-DOS, Macintosh и ISO). Поради това често възникват проблеми с прехвърлянето на руски текст от един компютър на друг, от една софтуерна система в друга.

Хронологично, един от първите стандарти за кодиране на руски букви на компютри беше KOI8 ("Код за обмен на информация, 8 бита"). Това кодиране е използвано още през 70-те години на компютри от компютърната серия ES, а от средата на 80-те години започва да се използва в първите русифицирани версии на операционната система UNIX.

От началото на 90-те години, времето на доминиране на операционната система MS DOS, кодирането CP866 остава ("CP" означава "Кодова страница", "кодова страница").

Компютрите на Apple, работещи с операционна система Mac OS, използват собствено Mac кодиране.

Освен това Международната организация по стандартизация (ISO) одобри друго кодиране, наречено ISO 8859-5, като стандарт за руския език.

Най-често използваното в момента кодиране е Microsoft Windows, съкратено CP1251.

От края на 90-те години проблемът със стандартизирането на кодирането на знаци е решен чрез въвеждането на нов международен стандарт, наречен Unicode. Това е 16-битово кодиране, т.е. той заделя 2 байта памет за всеки знак. Разбира се, това увеличава обема на заетата памет 2 пъти. Но такава кодова таблица позволява включването на до 65536 знака. Пълната спецификация на стандарта Unicode включва всички съществуващи, изчезнали и изкуствено създадени азбуки на света, както и много математически, музикални, химически и други символи.

Нека се опитаме да използваме ASCII таблица, за да си представим как ще изглеждат думите в паметта на компютъра.

Вътрешно представяне на думи в компютърната памет

Понякога се случва текст, състоящ се от букви от руската азбука, получен от друг компютър, да не може да бъде прочетен - на екрана на монитора се вижда някаква „абракадабра“. Това се случва, защото компютрите използват различни кодировки на знаци за руския език.

Компютрите не разбират думите и числата, както хората. Съвременният софтуер позволява на крайния потребител да игнорира това, но на най-ниските нива вашият компютър работи с двоичен електрически сигнал, който има само две състояния: дали има ток или не. За да "разбере" сложни данни, вашият компютър трябва да ги кодира в двоичен формат.

Двоичната система се основава на две цифри, 1 и 0, съответстващи на включени и изключени състояния, които вашият компютър може да разбере. Вероятно сте запознати с десетичната система. Той използва десет цифри, от 0 до 9, и след това преминава към следващия ред, за да формира двуцифрени числа, като всяко число е десет пъти по-голямо от предишното. Двоичната система е подобна, като всяка цифра е два пъти по-голяма от предишната.

Преброяване в двоичен формат

В двоичния израз първата цифра е еквивалентна на 1 в десетичната система. Втората цифра е 2, третата е 4, четвъртата е 8 и така нататък - удвоявайки се всеки път. Добавянето на всички тези стойности ще ви даде числото в десетичен формат.

1111 (в двоичен) = 8 + 4 + 2 + 1 = 15 (в десетичен)

Отчитането на 0 ни дава 16 възможни стойности за четири двоични бита. Преместете 8 бита и ще получите 256 възможни стойности. Това заема много повече място за представяне, тъй като четири десетични цифри ни дават 10 000 възможни стойности. Разбира се, двоичният код заема повече място, но компютрите разбират двоичните файлове много по-добре от десетичната система. И за някои неща, като логическа обработка, двоичната е по-добра от десетичната.

Трябва да се каже, че има друга основна система, която се използва в програмирането: шестнадесетичен. Въпреки че компютрите не работят в шестнадесетичен формат, програмистите го използват, за да представят двоични адреси в четим от човека формат, когато пишат код. Това е така, защото две цифри в шестнадесетично число могат да представляват цял ​​байт, което означава, че заместват осем цифри в двоична система. Шестнадесетичната система използва числата 0-9, както и буквите от A до F, за да създаде допълнителни шест цифри.

Защо компютрите използват двоични файлове?

Кратък отговор: хардуер и закони на физиката. Всеки знак във вашия компютър е електрически сигнал, а в ранните дни на компютрите измерването на електрическите сигнали беше много по-трудно. Имаше по-голям смисъл да се разграничи само състоянието "включено", представено от отрицателен заряд, и състоянието "изключено", представено от положителен заряд.

За тези, които не знаят защо "изключено" е представено от положителен заряд, това е защото електроните имат отрицателен заряд, а повече електрони означава повече ток с отрицателен заряд.

Така се използват ранни компютри с размер на стая двоични файловеза да създадат своите системи и въпреки че използваха по-старо, по-обемно оборудване, те работеха на същите основни принципи. Съвременните компютри използват т.нар транзистор за извършване на изчисления с двоичен код.

Ето диаграма на типичен транзистор:

По същество той позволява на тока да тече от източника към изтичането, ако има ток в портата. Това формира двоичен ключ. Производителите могат да направят тези транзистори невероятно малки - до 5 нанометра или размера на две вериги на ДНК. Ето как работят съвременните процесори и дори те могат да страдат от проблеми при разграничаване между включени и изключени състояния (въпреки че това се дължи на нереалистичния им молекулен размер, който е подложен на странността на квантовата механика).

Защо само двоична система

Така че може би си мислите: „Защо само 0 и 1? Защо не добавите друг номер? Въпреки че това отчасти се дължи на традициите за създаване на компютри, в същото време добавянето на друга цифра би означавало необходимостта да се разграничи друго състояние на тока, а не само „изключено“ или „включено“.

Проблемът тук е, че ако искате да използвате няколко нива на напрежение, имате нужда от начин за лесно извършване на изчисления върху тях, а настоящият хардуер, способен на това, не е жизнеспособен като заместител на двоичните изчисления. Например има т.нар троен компютър, разработен през 50-те години на миналия век, но развитието спря дотук. Троична логика по-ефективен от двоичния, но все още няма ефективен заместител на двоичния транзистор или поне няма транзистор в същия малък мащаб като двоичния.

Причината да не можем да използваме троичната логика се свежда до това как транзисторите са свързани в компютъра и как се използват за математически изчисления. Транзисторът получава информация на два входа, извършва операция и връща резултата на един изход.

По този начин бинарната математика е по-лесна за компютъра от всичко друго. Двоичната логика лесно се преобразува в двоични системи, като True и False съответстват на On и Off състояния.

Двоичната таблица на истината, работеща на двоична логика, ще има четири възможни изхода за всяка фундаментална операция. Но тъй като тройните порти използват три входа, тройната таблица на истината ще има 9 или повече. Докато двоичната система има 16 възможни оператора (2^2^2), троичната система би имала 19683 (3^3^3). Мащабирането се превръща в проблем, защото докато trinity е по-ефективно, то е и експоненциално по-сложно.

Кой знае?В бъдеще може да видим троични компютри, тъй като бинарната логика е изправена пред предизвикателства за миниатюризация. Засега светът ще продължи да работи в двоичен режим.



 

Може да е полезно да прочетете: