Дешифриране на двоичен код онлайн. Двоичен код

Двоичният код представлява текст, инструкции на компютърния процесор или други данни, използвайки произволна двусимволна система. Най-често това е система от 0 и 1, която присвоява модел от двоични цифри (битове) на всеки символ и инструкция. Например, двоичен низ от осем бита може да представлява всяка от 256 възможни стойности и следователно може да генерира много различни елементи. Прегледите на двоичния код от световната професионална общност на програмистите показват, че това е основата на професията и основният закон на функционирането на компютърните системи и електронните устройства.

Дешифриране на двоичния код

В компютрите и телекомуникациите двоичните кодове се използват за различни методи за кодиране на знаци за данни в битови низове. Тези методи могат да използват низове с фиксирана или променлива ширина. Има много набори от символи и кодировки за конвертиране в двоичен код. В код с фиксирана ширина всяка буква, цифра или друг знак се представя от битов низ със същата дължина. Този битов низ, интерпретиран като двоично число, обикновено се показва в кодови таблици в осмична, десетична или шестнадесетична система.

Двоично декодиране: битов низ, интерпретиран като двоично число, може да бъде преобразуван в десетично число. Например малката буква a, ако е представена от битовия низ 01100001 (както в стандартния ASCII код), може също да бъде представена като десетично число 97. Преобразуването на двоичен код в текст е същата процедура, само в обратен ред.

Как работи

От какво се състои двоичният код? Кодът, използван в цифровите компютри, се основава на това, че има само две възможни състояния: включено. и изключено, обикновено означавано с нула и едно. Докато в десетичната система, която използва 10 цифри, всяка позиция е кратна на 10 (100, 1000 и т.н.), в двоичната система всяка позиция на цифрата е кратна на 2 (4, 8, 16 и т.н.) . Сигналът с двоичен код е поредица от електрически импулси, които представляват числа, символи и операции, които трябва да бъдат извършени.

Устройство, наречено часовник, изпраща регулярни импулси и компоненти като транзистори се включват (1) или изключват (0), за да предават или блокират импулсите. В двоичния код всяко десетично число (0-9) е представено от набор от четири двоични цифри или бита. Четирите основни операции на аритметиката (събиране, изваждане, умножение и деление) могат да бъдат сведени до комбинации от фундаментални булеви алгебрични операции върху двоични числа.

Битът в теорията на комуникацията и информацията е единица данни, еквивалентна на резултата от избор между две възможни алтернативи в двоичната бройна система, често използвана в цифровите компютри.

Прегледи на двоичен код

Природата на кода и данните е основна част от фундаменталния свят на ИТ. Този инструмент се използва от специалисти от глобалното ИТ „зад кулисите“ - програмисти, чиято специализация е скрита от вниманието на обикновения потребител. Прегледите на двоичния код от разработчиците показват, че тази област изисква задълбочено изучаване на математическите основи и обширна практика в областта на математическия анализ и програмиране.

Двоичният код е най-простата форма на компютърен код или програмни данни. Представен е изцяло от двоична цифрова система. Според прегледите на двоичния код, той често се свързва с машинен код, тъй като двоичните набори могат да бъдат комбинирани, за да образуват изходен код, който се интерпретира от компютър или друг хардуер. Това е отчасти вярно. използва набори от двоични цифри за формиране на инструкции.

Заедно с най-основната форма на код, двоичният файл представлява и най-малкото количество данни, което преминава през всички сложни хардуерни и софтуерни системи от край до край, които обработват днешните ресурси и активи от данни. Най-малкото количество данни се нарича бит. Текущите низове от битове стават код или данни, които се интерпретират от компютъра.

Двоично число

В математиката и цифровата електроника двоичното число е число, изразено в числова система с основа 2 или двоична числова система, която използва само два знака: 0 (нула) и 1 (едно).

Бройната система с основа 2 е позиционен запис с радиус 2. Всяка цифра се нарича бит. Поради простата си реализация в цифрови електронни схеми, използващи логически правила, двоичната система се използва от почти всички съвременни компютри и електронни устройства.

История

Съвременната двоична бройна система като основа за двоичен код е изобретена от Готфрид Лайбниц през 1679 г. и е представена в неговата статия „Обяснена двоичната аритметика“. Двоичните числа са централни за теологията на Лайбниц. Той вярваше, че двоичните числа символизират християнската идея за творчество ex nihilo или създаване от нищо. Лайбниц се опита да намери система, която да трансформира вербалните логически твърдения в чисто математически данни.

Двоичните системи, предхождащи Лайбниц, също са съществували в древния свят. Пример за това е китайската двоична система И Дзин, където текстът за гадаене се основава на двойствеността на ин и ян. В Азия и Африка барабани с прорези с бинарни тонове са били използвани за кодиране на съобщения. Индийският учен Пингала (около 5 век пр. н. е.) разработи двоична система, за да опише прозодията в своя труд Чандашутрема.

Жителите на остров Мангарева във Френска Полинезия са използвали хибридна двоично-десетична система до 1450 г. През 11-ти век ученият и философ Шао Йонг разработи метод за организиране на хексаграми, който съответства на последователността от 0 до 63, както е представена в двоичен формат, като ин е 0, а ян е 1. Редът също е лексикографски ред в блокове от елементи, избрани от набор от два елемента.

Ново време

През 1605 г. обсъжда система, в която буквите от азбуката могат да бъдат редуцирани до последователности от двоични цифри, които след това могат да бъдат кодирани като фини вариации на типа във всеки произволен текст. Важно е да се отбележи, че Франсис Бейкън е този, който допълва общата теория на двоичното кодиране с наблюдението, че този метод може да се използва с всякакви обекти.

Друг математик и философ на име Джордж Бул публикува статия през 1847 г., наречена „Математически анализ на логиката“, която описва алгебричната система на логиката, известна днес като булева алгебра. Системата се основава на двоичен подход, който се състои от три основни операции: И, ИЛИ и НЕ. Тази система не заработи, докато студент от MIT на име Клод Шанън не забеляза, че булевата алгебра, която изучаваше, беше подобна на електрическа верига.

Шанън написва дисертация през 1937 г., която прави важни открития. Тезата на Шанън стана отправна точка за използването на двоичен код в практически приложения като компютри и електрически вериги.

Други форми на двоичен код

Bitstring не е единственият тип двоичен код. Двоична система като цяло е всяка система, която позволява само две опции, като например превключване в електронна система или прост верен или неверен тест.

Брайловото писмо е вид двоичен код, широко използван от незрящи хора за четене и писане чрез докосване, кръстен на своя създател Луис Брайл. Тази система се състои от решетки от по шест точки, по три на колона, в които всяка точка има две състояния: повдигната или вдлъбната. Различни комбинации от точки могат да представляват всички букви, цифри и препинателни знаци.

Американският стандартен код за обмен на информация (ASCII) използва 7-битов двоичен код за представяне на текст и други знаци в компютри, комуникационно оборудване и други устройства. На всяка буква или символ се присвоява номер от 0 до 127.

Двоично кодиран десетичен или BCD е двоично кодирано представяне на цели числа, което използва 4-битова графика за кодиране на десетични цифри. Четири двоични бита могат да кодират до 16 различни стойности.

В BCD-кодираните числа само първите десет стойности във всяка хапка са валидни и кодират десетичните цифри с нули след деветките. Останалите шест стойности са невалидни и могат да причинят или изключение на машината, или неопределено поведение, в зависимост от внедряването на BCD аритметика на компютъра.

BCD аритметиката понякога се предпочита пред числовите формати с плаваща запетая в търговски и финансови приложения, където поведението при закръгляване на сложни числа е нежелателно.

Приложение

Повечето съвременни компютри използват програма с двоичен код за инструкции и данни. CD, DVD и Blu-ray дискове представят аудио и видео в двоична форма. Телефонните разговори се извършват цифрово в междуселищни и мобилни телефонни мрежи, като се използва импулсна кодова модулация и в мрежи за глас през IP.

Нека да разберем как става всичко конвертиране на текстове в цифров код? Между другото, на нашия уебсайт можете да конвертирате всеки текст в десетичен, шестнадесетичен, двоичен код с помощта на онлайн калкулатора на кодове.

Кодиране на текст.

Според компютърната теория всеки текст се състои от отделни знаци. Тези знаци включват: букви, цифри, малки препинателни знаци, специални знаци (“”, №, () и т.н.), те също включват интервали между думите.

Необходима база от знания. Наборът от символи, с които пиша текст, се нарича АЗБУКА.

Броят на символите, взети в една азбука, представлява нейната сила.

Количеството информация може да се определи по формулата: N = 2b

N е същата мощност (много символи),
b - Бит (тегло на взетия символ).

Азбука, съдържаща 256, може да съдържа почти всички необходими знаци. Такива азбуки се наричат ДОСТАТЪЧНИ.

Ако вземем азбука с капацитет 256 и имайте предвид, че 256 = 28

8 бита винаги се наричат 1 байт:
1 байт = 8 бита.

Ако преобразувате всеки знак в двоичен код, тогава този компютърен текстов код ще заема 1 байт.

Как може да изглежда текстовата информация в компютърната памет?

Всеки текст се въвежда на клавиатурата, на клавишите на клавиатурата виждаме познатите ни знаци (цифри, букви и др.). Те влизат в оперативната памет на компютъра само под формата на двоичен код. Двоичният код за всеки знак изглежда като осемцифрено число, например 00111111.

Тъй като байтът е най-малката адресируема част от паметта и паметта се адресира към всеки знак поотделно, удобството на такова кодиране е очевидно. Въпреки това, 256 символа е много удобно количество за всяка символна информация.

Естествено възникна въпросът Кое конкретно? осемцифрен кодпринадлежи на всеки герой? И как да конвертирате текст в цифров код?

Този процес е условен и ние имаме право да измислим различни начини за кодиране на символи. Всеки знак от азбуката има свой собствен номер от 0 до 255. И на всеки номер е присвоен код от 00000000 до 11111111.

Таблицата за кодиране е „мамски лист“, в който знаците на азбуката са посочени в съответствие със серийния номер. Различните типове компютри използват различни таблици за кодиране.

ASCII (или Asci) се превърна в международен стандарт за персонални компютри. Масата има две части.

Първата половина е за ASCII таблицата. (Това беше първото полувреме, което се превърна в стандарт.)

Спазването на лексикографския ред, т.е. в таблицата буквите (малки и главни) са посочени в строг азбучен ред, а числата са във възходящ ред, се нарича принцип на последователно кодиране на азбуката.

За руската азбука те също следват принцип на последователно кодиране.

Сега, в наше време, те използват цели пет системи за кодиранеРуска азбука (KOI8-R, Windows. MS-DOS, Macintosh и ISO). Поради броя на системите за кодиране и липсата на един стандарт, много често възникват недоразумения при прехвърлянето на руски текст в неговата компютърна форма.

Един от първите стандарти за кодиране на руската азбукаа на персонални компютри те считат KOI8 („Код за обмен на информация, 8 бита“). Това кодиране е използвано в средата на седемдесетте години на серия компютри ES, а от средата на осемдесетте години започва да се използва в първите операционни системи UNIX, преведени на руски език.

От началото на деветдесетте години, така нареченото време, когато доминираше операционната система MS DOS, се появи системата за кодиране CP866 ("CP" означава "Кодова страница").

Гигантските компютърни компании APPLE, с тяхната иновативна система, под която са работили (Mac OS), започват да използват собствена система за кодиране на MAC азбуката.

Международната организация по стандартизация (ISO) определя друг стандарт за руския език азбучна система за кодиране, който се нарича ISO 8859-5.

И най-разпространената система за кодиране на азбуката в наши дни е изобретена в Microsoft Windows и се нарича CP1251.

От втората половина на 90-те години проблемът със стандарта за превод на текст в цифров код за руски език и не само беше решен чрез въвеждане на система, наречена Unicode, в стандарта. Той е представен от шестнадесет-битово кодиране, което означава, че точно два байта RAM са разпределени за всеки знак. Разбира се, с това кодиране разходите за памет се удвояват. Въпреки това, такава кодова система позволява до 65 536 знака да бъдат преобразувани в електронен код.

Спецификата на стандартната система Unicode е включването на абсолютно всяка азбука, била тя съществуваща, изчезнала или изобретена. В крайна сметка, абсолютно всяка азбука, в допълнение към това системата Unicode включва много математически, химически, музикални и общи символи.

Нека използваме ASCII таблица, за да видим как може да изглежда една дума в паметта на вашия компютър.

Често се случва вашият текст, който е написан с букви от руската азбука, да не се чете, това се дължи на разликите в системите за кодиране на азбуката на компютрите. Това е много често срещан проблем, който се среща доста често.

Всички знаци и букви могат да бъдат кодирани с помощта на осем двоични бита. Най-често срещаните таблици с двоични знаци са ASCII и ANSI, които могат да се използват за писане на текст в микропроцесори. В ASCII и ANSI таблиците първите 128 знака са еднакви. Тази част от таблицата съдържа кодове за цифри, препинателни знаци, главни и малки латински букви и контролни знаци. Националните разширения на символните таблици и псевдографичните символи се съдържат в последните 128 кода на тези таблици, поради което руските текстове в операционните системи DOS и WINDOWS не съвпадат.

При първото запознаване с компютри и микропроцесори може да възникне въпросът - „как да конвертирате текст в двоичен код?“ Тази трансформация обаче е най-простото действие! За да направите това, трябва да използвате всеки текстов редактор. Най-простата програма Notepad, включена в операционната система Windows, също е подходяща. Подобни редактори присъстват във всички програмни среди за езици като SI, Pascal или Java. Трябва да се отбележи, че най-разпространеният текстов редактор, Word, не е подходящ за обикновено преобразуване на текст в двоичен код. Този тестов редактор въвежда огромно количество допълнителна информация, като цвят на буквите, курсив, подчертаване, език, на който е написана определена фраза и шрифт.

Трябва да се отбележи, че всъщност комбинацията от нули и единици, с които е кодирана текстовата информация, не е двоичен код, т.к. битовете в този код не се подчиняват на законите. Въпреки това, в интернет фразата за търсене „двоично представяне на букви“ е най-често срещаната. Таблица 1 показва съответствието на двоичните кодове с буквите от латинската азбука. За краткост последователността от нули и единици в тази таблица е представена в десетични и шестнадесетични кодове.

маса 1Таблица за представяне на латински букви в двоичен код (ASCII)

Десетичен код	Шестнадесетичен код	Символ на дисплея	Значение
0	00		NUL
1	01	☺	(показва контролна дума)
2	02	☻	(Първата предадена дума)
3	03		ETX (последна дума на предаване)
4	04	♦	EOT (край на предаването)
5	05	♣	ENQ (инициализация)
6	06	♠	ACK (потвърждение)
7	07		БЕЛ
8	08	◘	Б.С.
9	09	○	HT (хоризонтален раздел)
10	0А	◙	LF (подаване на ред)
11	0Б	♂	VT (вертикален раздел)
12	0С	♀	FF (следваща страница)
13	0D	♪	CR (връщане на каретка)
14	0E	♫	SO (двойна ширина)
15	0F	☼	SI (твърдо уплътнение)
16	10		DLE
17	11	◄	DC1
18	12	↕	DC2 (компактен печат Cancel)
19	13	‼	DC3 (готов)
20	14	¶	DC4 (отмяна с двойна ширина)
21	15	§	NAC (без потвърждение)
22	16	▬	SYN
23	17	↨	ETB
24	18		МОГА
25	19	↓	Е.М.
26	1А	→	ПОДП
27	1Б	←	ESC (начало на контролната последователност)
28	1C	∟	FS
29	1D	↔	Г.С.
30	1E	▲	Р.С.
31	1F	▼	НАС
32	20		пространство
33	21	!	Удивителен знак
34	22	«	Ъглова скоба
35	23	#	Знак за число
36	24	$	Знак за валута (долар)
37	25	%	Знак за процент
38	26	&	амперсанд
39	27	"	апостроф
40	28	(	Отваряща скоба
41	29	)	Затваряща скоба
42	2А	*	звезда
43	2B	+	Знак плюс
44	2C	,	Запетая
45	2D	-	Знак минус
46	2E	.	Точка
47	2F	/	Дробна лента
48	30	0	Цифра нула
49	31	1	Номер едно
50	32	2	Номер две
51	33	3	Номер три
52	34	4	Номер четири
53	35	5	Номер пет
54	36	6	Номер шест
55	37	7	Номер седем
56	38	8	Номер осем
57	39	9	Номер девет
58	3А	:	Дебело черво
59	3B	;	точка и запетая
60	3C	<	Знак по-малко
61	3D	=	Знак за равенство
62	3E	>	Още знак
63	3F	?	Въпросителен знак
64	40	@	Търговски етаж
65	41	А	Главна латинска буква А
66	42	б	Главна латинска буква B
67	43	° С	Главна латинска буква C
68	44	д	Главна латинска буква D
69	45	д	Главна латинска буква E
70	46	Е	Главна латинска буква F
71	47	Ж	Главна латинска буква G
72	48	з	Главна латинска буква H
73	49	аз	Главна латинска буква I
74	4А	Дж	Главна латинска буква J
75	4B	К	Главна латинска буква K
76	4C	Л	Главна латинска буква L
77	4D	М	Главна латинска буква
78	4E	н	Главна латинска буква N
79	4F	О	Главна латинска буква О
80	50	П	Главна латинска буква P
81	51	Q	Главна латинска буква
82	52	Р	Главна латинска буква R
83	53	С	Главна латинска буква S
84	54	T	Главна латинска буква Т
85	55	U	Главна латинска буква U
86	56	V	Главна латинска буква V
87	57	У	Главна латинска буква W
88	58	х	Главна латинска буква X
89	59	Y	Главна латинска буква Y
90	5А	З	Главна латинска буква Z
91	5B	[	Отваряща квадратна скоба
92	5C	\	Наклонена черта
93	5 Д	]	Затваряща квадратна скоба
94	5E	^	"капак"
95	5	_	Долна черта
96	60	`	апостроф
97	61	а	малка латинска буква a
98	62	b	малка латинска буква b
99	63	° С	малка латинска буква c
100	64	д	малка латинска буква d
101	65	д	малка латинска буква e
102	66	f	малка латинска буква f
103	67	ж	малка латинска буква g
104	68	ч	малка латинска буква h
105	69	аз	малка латинска буква i
106	6А	й	малка латинска буква j
107	6B	к	малка латинска буква k
108	6C	л	малка латинска буква l
109	6D	м	малка латинска буква m
110	6E	н	малка латинска буква n
111	6F	о	малка латинска буква o
112	70	стр	малка латинска буква p
113	71	р	малка латинска буква q
114	72	r	малка латинска буква r
115	73	с	малка латинска буква s
116	74	T	малка латинска буква t
117	75	u	малка латинска буква u
118	76	v	латинска малка буква v
119	77	w	малка латинска буква w
120	78	х	латинска малка буква x
121	79	г	малка латинска буква у
122	7А	z	малка латинска буква z
123	7B	{	Отваряща скоба
124	7C	\|	Вертикална лента
125	7D	}	Затваряща скоба
126	7E	~	Тилда
127	7F	⌂

В класическата версия на таблицата със символи ASCII няма руски букви и се състои от 7 бита. По-късно обаче тази таблица беше разширена до 8 бита и в горните 128 реда се появиха руски букви в двоичен код и псевдографски символи. Като цяло втората част съдържа националните азбуки на различни страни и руските букви са само един от възможните набори (855); може да има френска (863), немска (1141) или гръцка (737) таблица. Таблица 2 показва пример за представяне на руски букви в двоичен код.

Таблица 2.Таблица за представяне на руски букви в двоичен код (ASCII)

Десетичен код	Шестнадесетичен код	Символ на дисплея	Значение
128	80	А	Главна руска буква А
129	81	б	Главна руска буква Б
130	82	IN	Главна руска буква Б
131	83	Ж	Главна руска буква Г
132	84	д	Главна руска буква Д
133	85	д	Главна руска буква Е
134	86	И	Главна руска буква Ж
135	87	З	Главна руска буква Z
136	88	И	Главна руска буква I
137	89	Y	Главна руска буква Y
138	8А	ДА СЕ	Главна руска буква К
139	8B	Л	Главна руска буква Л
140	8C	М	Главна руска буква М
141	8D	н	Главна руска буква Н
142	8E	ОТНОСНО	Главна руска буква О
143	8F	П	Главна руска буква П
144	90	Р	Главна руска буква Р
145	91	СЪС	Главна руска буква С
146	92	T	Главна руска буква Т
147	93	U	Главна руска буква U
148	94	Е	Главна руска буква Ф
149	95	х	Главна руска буква X
150	96	° С	Главна руска буква Т
151	97	з	Главна руска буква CH
152	98	Ш	Главна руска буква Ш
153	99	SCH	Главна руска буква Ш
154	9А	Комерсант	Главна руска буква Ъ
155	9B	Y	Главна руска буква Y
156	9C	b	Главна руска буква б
157	9D	д	Главна руска буква Е
158	9E	Ю	Главна руска буква Ю
159	9F	аз	Главна руска буква I
160	A0	А	Малка руска буква а
161	A1	b	Малка руска буква б
162	A2	V	Руска малка буква v
163	A3	Ж	Малка руска буква ж
164	A4	д	Малка руска буква d
165	A5	д	Малка руска буква е
166	A6	и	Малка руска буква з
167	A7	ч	Малка руска буква з
168	A8	И	Малка руска буква и
169	A9	th	Малка руска буква th
170	А.А.	Да се	Руска малка буква к
171	AB	л	Малка руска буква л
172	A.C.	м	Малка руска буква м
173	AD	н	Малка руска буква n
174	А.Е.	О	Руска малка буква о
175	А.Ф.	П	Малка руска буква п
176	B0	░
177	B1	▒
178	B2	▓
179	B3	│	Псевдографски символ
180	B4	┤	Псевдографски символ
181	B5	╡	Псевдографски символ
182	B6	╢	Псевдографски символ
183	B7	╖	Псевдографски символ
184	B8	╕	Псевдографски символ
185	B9	╣	Псевдографски символ
186	Б.А.	║	Псевдографски символ
187	BB	╗	Псевдографски символ
188	пр.н.е.	╝	Псевдографски символ
189	BD	╜	Псевдографски символ
190	БЪДА	╛	Псевдографски символ
191	Б.Ф.	┐	Псевдографски символ
192	C0	└	Псевдографски символ
193	C1	┴	Псевдографски символ
194	C2	┬	Псевдографски символ
195	C3	├	Псевдографски символ
196	C4	─	Псевдографски символ
197	C5	┼	Псевдографски символ
198	C6	╞	Псевдографски символ
199	C7	╟	Псевдографски символ
200	C8	╚	Псевдографски символ
201	C9	╔	Псевдографски символ
202	C.A.	╩	Псевдографски символ
203	C.B.	╦	Псевдографски символ
204	CC	╠	Псевдографски символ
205	CD	═	Псевдографски символ
206	н.е.	╬	Псевдографски символ
207	CF	╧	Псевдографски символ
208	D0	╨	Псевдографски символ
209	D1	╤	Псевдографски символ
210	D2	╥	Псевдографски символ
211	D3	╙	Псевдографски символ
212	D4	╘	Псевдографски символ
213	D5	╒	Псевдографски символ
214	D6	╓	Псевдографски символ
215	D7	╫	Псевдографски символ
216	D8	╪	Псевдографски символ
217	D9	┘	Псевдографски символ
218	Д.А.	┌	Псевдографски символ
219	Д.Б.	█
220	DC	▄
221	DD	▌
222	DE	▐
223	DF	▀
224	E0	Р	Малка руска буква р
225	E1	с	Руска малка буква s
226	E2	T	Малка руска буква т
227	E3	при	Руска малка буква u
228	E4	f	Малка руска буква ф
229	E5	х	Руска малка буква х
230	E6	ц	Малка руска буква c
231	E7	ч	Малка руска буква ч
232	E8	w	Малка руска буква ш
233	E9	sch	Руска малка буква ш
234	Е.А.	ъ	Малка руска буква ъ
235	Е.Б.	с	Малка руска буква ы
236	E.C.	b	Малка руска буква ь
237	ЕД	ъъъ	Малка руска буква е
238	Е.Е.	Ю	Малка руска буква ю
239	Е.Ф.	аз	Малка руска буква i
240	F0	Йо	Главна руска буква Йо
241	F1	д	Малка руска буква ё
242	F2	Є
243	F3	є
244	F4	Ї
245	F5	Ї
246	F6	Ў
247	F7	ў
248	F8	°	Знак за степен
249	F9	∙	Знак за умножение (точка)
250	F.A.	·
251	FB	√	Радикал (вземане на корен)
252	F.C.	№	Знак за число
253	FD	¤	Валутен знак (рубла)
254	F.E.	■
255	FF

При писане на текстове, в допълнение към двоичните кодове, които директно показват букви, се използват кодове, които показват прехода към нов ред и връщането на курсора (връщане на каретката) към нулевата позиция на реда. Тези символи обикновено се използват заедно. Техните двоични кодове съответстват на десетичните числа - 10 (0A) и 13 (0D). Като пример, по-долу е част от текста на тази страница (изхвърляне на паметта). Първият му параграф е написан в този раздел. Следният формат се използва за показване на информация в дъмп на паметта:

първата колона съдържа двоичния адрес на първия байт на реда
Следващите шестнадесет колони съдържат байтовете, съдържащи се в текстовия файл. За по-удобно определяне на номера на байта след осмата колона се изчертава вертикална линия. Байтовете, за краткост, са представени в шестнадесетичен код.
в последната колона същите тези байтове са представени като показваеми азбучни знаци

00000000: 82 E1 A5 20 E1 A8 AC A2 ¦ AE AB EB 20 A8 20 A1 E3 Всички символи и 00000010: AA A2 EB 20 AC AE A3 E3 ¦ E2 20 A1 EB E2 EC 20 A7 коефициентите могат да бъдат 3 00000020: A0 AA AE A4 A8 E0 AE A2 ¦ A0 AD EB 20 AF E0 A8 20 кодиран в 00000030: AF AE AC AE E9 A8 20 A2 ¦ AE E1 EC AC A8 20 A4 A2 помощ при осем врати 00000040: AE A8 E7 AD EB E5 20 E1 ¦ A8 AC A2 AE AB AE A2 2E основни знаци. 00000050: 0D 0A 8D A0 A8 A1 AE AB ¦ A5 A5 20 E0 A0 E1 AF E0 ♪◙Най-често 00000060: AE E1 E2 E0 A0 AD A5 AD ¦ AD EB AC A8 20 E2 A0 A1 странен раздел 00000070: AB A8 E6 A0 AC A8 20 EF ¦ A2 AB EF EE E2 E1 EF 20 души са 00000080: E2 A0 A1 AB A8 E6 EB 20 ¦ 41 53 43 49 49 20 E1 20 ASCII таблици с 00000090: AD A0 E6 A8 AE AD A0 AB ¦ EC AD EB AC A8 0D 0A E0 национален♪◙р 000000A0: A0 E1 E8 A8 E0 A5 AD A8 ¦ EF AC A8 2C 20 AF E0 A8 разширения, при 000000B0: AC A5 AD EF EE E9 A8 A5 ¦ E1 EF 20 A2 20 44 4F 53 промяна в DOS 000000C0: 20 28 A8 20 AA AE E2 AE ¦ E0 EB A5 20 AC AE A6 AD (и който може да се използва 000000D0: AE 20 A8 E1 AF AE AB EC ¦ A7 AE A2 A0 E2 EC 20 A4 или да използвате d 000000E0 : AB EF 20 A7 A0 AF A8 E1 ¦ A8 0D 0A E2 A5 AA E1 E2 за запис♪◙текст 000000F0: AE A2 20 A2 20 AC A8 AA ¦ E0 AE AF E0 AE E6 A5 E1 ov в микропроцес 00000100: E1 AE E0 A0 E5 29 2C 20 ¦ A8 20 E2 A0 A1 AB A8 E6 sorah), и таблици 00000110: EB 20 41 4E 53 49 2C 20 ¦ AF E0 A8 AC A5 AD EF EE s ANSI, използвам 00000120: E9 A8 A5 E1 EF 20 A2 20 ¦ 57 49 4E 44 4F 57 53 2E налични в WINDOWS. 00000130: 20 82 20 E2 A0 A1 AB A8 ¦ E6 A0 E5 0D 0A 41 53 43 В таблици♪◙ASC 00000140: 49 49 20 A8 20 41 4E 53 ¦ 49 20 AF A5 E0 A2 EB A5 II и първо ANSI 0 0000150: 20 31 32 38 20 E1 A8 AC ¦ A2 AE AB AE A2 20 E1 AE 128 знака с 00000160: A2 AF A0 A4 A0 EE E2 2E ¦ 20 82 20 ED E2 AE A9 20 падане. В тази 00000170: E7 A0 E1 E2 A8 20 E2 A0 ¦ A1 AB A8 E6 EB 20 E1 AE част от таблицата с 00000180: A4 A5 E0 A6 A0 E2 E1 EF ¦ 0D 0A E1 A8 AC A2 AE AB се съхранява♪◙знак 00000190: EB 20 E6 A8 E4 E0 2C 20 ¦ A7 AD A0 AA AE A2 20 AF числа, знаци p 000001A0: E0 A5 AF A8 AD A0 AD A8 ¦ EF 2C 20 AB A0 E2 A8 AD повторение, латиница 000001B0: E1 AA A8 A5 20 A1 E3 AA A2 EB 20 A2 A5 E0 E5 AD 0A E3 AF E0 A0 A2 главни и ♪◙контролери 000001E0: AB EF EE E9 A8 A5 20 E1 ¦ A8 AC A2 AE AB EB 2E 20 кастинг знака. 000001F0: 8D A0 E6 A8 AE AD A0 AB ¦ EC AD EB A5 20 E0 A0 E1 Национални състезания 00000200: E8 A8 E0 A5 AD A8 EF 20 ¦ E1 A8 AC A2 AE AB EC AD символ за разширение 00000210: EB E5 20 E2 A0 A1 AB A8 ¦ E6 20 A8 20 E1 A8 AC A2 таблици и символи 00000220: AE AB EB 0D 0A AF E1 A5 ¦ A2 A4 AE A3 E0 A0 E4 A8 псевдографи 00000230: AA A8 20 E1 AE A4 A5 E0 ¦ A6 A 0 E2 E1 EF 20 A2 20 ki се съдържат в 00000240: AF AE E1 AB A5 A4 AD A8 ¦ E5 20 31 32 38 20 AA AE последните 128 kos 00000250: A4 A0 E5 20 ED E2 A8 E5 ¦ 20 E2 A0 A1 AB A8 E6 2C DAX от тези таблици, 00000260: 20 AF AE E2 AE AC E3 ¦ 20 E0 E1 E1 AA A8 Следователно руснаци 00000270: 0A E2 AA E1 EB ¦ 20 A2 20 AE AF A5 E0 ♪ ◙ Текстове в Opera 00000280 : E6 A8 AE AD AD EB E5 20 ¦ E1 A8 E1 E2 A5 AC A0 E5 tion systems 00000290: 20 44 4F 53 20 A8 20 57 ¦ 49 4E 44 4F 57 53 20 AD DOS и WINDOWS n 000002A0: A5 20 E1 AE A2 AF A0 A4 ¦ A 0 EE E2 2E 0D 0A e съвпадат. ♪◙

В примера по-горе можете да видите, че първият ред текст заема 80 байта. Първият байт 82 съответства на буквата "B". Вторият байт E1 съответства на буквата "c". Третият байт A5 съответства на буквата "e". Следващият байт 20 показва празното пространство между думите (интервал) " ". Байтове 81 и 82 съдържат символи за връщане на каретка и за подаване на ред 0D 0A. Намираме тези знаци на двоичния адрес 00000050: Следващият ред от изходния текст не е кратен на 16 (дължината му е 76 букви), така че, за да намерим края му, първо ще трябва да намерим реда 000000E0: и да преброим девет колони от него. Там отново се записват байтовете за връщане на каретката и за подаване на ред 0D 0A. Останалата част от текста се анализира по абсолютно същия начин.

Дата на последна актуализация на файла: 12/04/2018

Литература:

Заедно със статията „Писане на текстове в двоичен код“ прочетете:

Представяне на двоични числа в паметта на компютър или микроконтролер
http://site/proc/IntCod.php

Понякога е удобно да съхранявате числа в паметта на процесора в десетична форма
http://site/proc/DecCod.php

Стандартни формати на числа с плаваща запетая за компютри и микроконтролери
http://site/proc/float/

Понастоящем както позиционните, така и непозиционните числови системи се използват широко както в технологиите, така и в ежедневието.
.php

Наборът от знаци, с които е написан текстът, се нарича азбука.

Броят на знаците в азбуката е негов мощност.

Формула за определяне на количеството информация: N=2b,

където N е степента на азбуката (брой знаци),

b – брой битове (информационно тегло на символа).

Азбуката, с капацитет от 256 знака, може да побере почти всички необходими знаци. Тази азбука се нарича достатъчно.

защото 256 = 2 8, тогава теглото на 1 символ е 8 бита.

Мерната единица 8 бита получи името 1 байт:

1 байт = 8 бита.

Двоичният код на всеки знак в компютърния текст заема 1 байт памет.

Как се представя текстовата информация в компютърната памет?

Удобството на кодирането на знаци байт по байт е очевидно, тъй като байтът е най-малката адресируема част от паметта и следователно процесорът може да има достъп до всеки знак поотделно, когато обработва текст. От друга страна, 256 знака са напълно достатъчен брой за представяне на голямо разнообразие от символична информация.

Сега възниква въпросът кой осембитов двоичен код да присвоите на всеки знак.

Ясно е, че това е условен въпрос, можете да измислите много методи за кодиране.

Всички символи на компютърната азбука са номерирани от 0 до 255. Всяко число съответства на осембитов двоичен код от 00000000 до 11111111. Този код е просто поредният номер на знака в двоичната бройна система.

Таблица, в която на всички символи от компютърната азбука са присвоени серийни номера, се нарича таблица за кодиране.

Различните типове компютри използват различни таблици за кодиране.

Таблицата се превърна в международен стандарт за компютри ASCII(четете aski) (Американски стандартен код за обмен на информация).

ASCII кодовата таблица е разделена на две части.

Само първата половина на таблицата е международният стандарт, т.е. символи с числа от 0 (00000000), до 127 (01111111).

Структура на ASCII кодираща таблица

Сериен номер	Код	Символ
0 - 31	00000000 - 00011111	Символи с числа от 0 до 31 обикновено се наричат контролни символи. Тяхната функция е да контролират процеса на показване на текст на екрана или печат, подаване на звуков сигнал, маркиране на текст и др.
32 - 127	00100000 - 01111111	Стандартна част от масата (английски). Това включва малки и главни букви от латинската азбука, десетични числа, препинателни знаци, всички видове скоби, търговски и други символи. Знак 32 е интервал, т.е. празна позиция в текста. Всички останали се отразяват с определени знаци.
128 - 255	10000000 - 11111111	Алтернативна част на таблицата (руски). Втората половина на ASCII кодовата таблица, наречена кодова страница (128 кода, започващи от 10000000 и завършващи с 11111111), може да има различни опции, като всяка опция има свой номер. Кодовата страница се използва предимно за настаняване на национални азбуки, различни от латиница. В руските национални кодировки знаците от руската азбука се поставят в тази част на таблицата.

Първата половина на ASCII кодовата таблица

Моля, обърнете внимание, че в таблицата за кодиране буквите (главни и малки) са подредени по азбучен ред, а числата са подредени във възходящ ред. Това спазване на лексикографски ред в подреждането на символите се нарича принцип на последователно кодиране на азбуката.

За буквите от руската азбука също се спазва принципът на последователно кодиране.

Втората половина на ASCII кодовата таблица

За съжаление в момента има пет различни кодировки на кирилица (KOI8-R, Windows. MS-DOS, Macintosh и ISO). Поради това често възникват проблеми с прехвърлянето на руски текст от един компютър на друг, от една софтуерна система в друга.

Хронологично, един от първите стандарти за кодиране на руски букви на компютри беше KOI8 ("Код за обмен на информация, 8 бита"). Това кодиране е използвано още през 70-те години на компютри от компютърната серия ES, а от средата на 80-те години започва да се използва в първите русифицирани версии на операционната система UNIX.

От началото на 90-те години, времето на доминиране на операционната система MS DOS, кодирането CP866 остава ("CP" означава "Кодова страница", "кодова страница").

Компютрите на Apple, работещи с операционна система Mac OS, използват собствено Mac кодиране.

Освен това Международната организация по стандартизация (ISO) одобри друго кодиране, наречено ISO 8859-5, като стандарт за руския език.

Най-често използваното в момента кодиране е Microsoft Windows, съкратено CP1251.

От края на 90-те години проблемът със стандартизирането на кодирането на знаци е решен чрез въвеждането на нов международен стандарт, наречен Unicode. Това е 16-битово кодиране, т.е. той заделя 2 байта памет за всеки знак. Разбира се, това увеличава обема на заетата памет 2 пъти. Но такава кодова таблица позволява включването на до 65536 знака. Пълната спецификация на стандарта Unicode включва всички съществуващи, изчезнали и изкуствено създадени азбуки на света, както и много математически, музикални, химически и други символи.

Нека се опитаме да използваме ASCII таблица, за да си представим как ще изглеждат думите в паметта на компютъра.

Вътрешно представяне на думи в компютърната памет

Понякога се случва текст, състоящ се от букви от руската азбука, получен от друг компютър, да не може да бъде прочетен - на екрана на монитора се вижда някаква „абракадабра“. Това се случва, защото компютрите използват различни кодировки на знаци за руския език.

Компютрите не разбират думите и числата, както хората. Съвременният софтуер позволява на крайния потребител да игнорира това, но на най-ниските нива вашият компютър работи с двоичен електрически сигнал, който има само две състояния: дали има ток или не. За да "разбере" сложни данни, вашият компютър трябва да ги кодира в двоичен формат.

Двоичната система се основава на две цифри, 1 и 0, съответстващи на включени и изключени състояния, които вашият компютър може да разбере. Вероятно сте запознати с десетичната система. Той използва десет цифри, от 0 до 9, и след това преминава към следващия ред, за да формира двуцифрени числа, като всяко число е десет пъти по-голямо от предишното. Двоичната система е подобна, като всяка цифра е два пъти по-голяма от предишната.

Преброяване в двоичен формат

В двоичния израз първата цифра е еквивалентна на 1 в десетичната система. Втората цифра е 2, третата е 4, четвъртата е 8 и така нататък - удвоявайки се всеки път. Добавянето на всички тези стойности ще ви даде числото в десетичен формат.

1111 (в двоичен) = 8 + 4 + 2 + 1 = 15 (в десетичен)

Отчитането на 0 ни дава 16 възможни стойности за четири двоични бита. Преместете 8 бита и ще получите 256 възможни стойности. Това заема много повече място за представяне, тъй като четири десетични цифри ни дават 10 000 възможни стойности. Разбира се, двоичният код заема повече място, но компютрите разбират двоичните файлове много по-добре от десетичната система. И за някои неща, като логическа обработка, двоичната е по-добра от десетичната.

Трябва да се каже, че има друга основна система, която се използва в програмирането: шестнадесетичен. Въпреки че компютрите не работят в шестнадесетичен формат, програмистите го използват, за да представят двоични адреси в четим от човека формат, когато пишат код. Това е така, защото две цифри в шестнадесетично число могат да представляват цял байт, което означава, че заместват осем цифри в двоична система. Шестнадесетичната система използва числата 0-9, както и буквите от A до F, за да създаде допълнителни шест цифри.

Защо компютрите използват двоични файлове?

Кратък отговор: хардуер и закони на физиката. Всеки знак във вашия компютър е електрически сигнал, а в ранните дни на компютрите измерването на електрическите сигнали беше много по-трудно. Имаше по-голям смисъл да се разграничи само състоянието "включено", представено от отрицателен заряд, и състоянието "изключено", представено от положителен заряд.

За тези, които не знаят защо "изключено" е представено от положителен заряд, това е защото електроните имат отрицателен заряд, а повече електрони означава повече ток с отрицателен заряд.

Така се използват ранни компютри с размер на стая двоични файловеза да създадат своите системи и въпреки че използваха по-старо, по-обемно оборудване, те работеха на същите основни принципи. Съвременните компютри използват т.нар транзистор за извършване на изчисления с двоичен код.

Ето диаграма на типичен транзистор:

По същество той позволява на тока да тече от източника към изтичането, ако има ток в портата. Това формира двоичен ключ. Производителите могат да направят тези транзистори невероятно малки - до 5 нанометра или размера на две вериги на ДНК. Ето как работят съвременните процесори и дори те могат да страдат от проблеми при разграничаване между включени и изключени състояния (въпреки че това се дължи на нереалистичния им молекулен размер, който е подложен на странността на квантовата механика).

Защо само двоична система

Така че може би си мислите: „Защо само 0 и 1? Защо не добавите друг номер? Въпреки че това отчасти се дължи на традициите за създаване на компютри, в същото време добавянето на друга цифра би означавало необходимостта да се разграничи друго състояние на тока, а не само „изключено“ или „включено“.

Проблемът тук е, че ако искате да използвате няколко нива на напрежение, имате нужда от начин за лесно извършване на изчисления върху тях, а настоящият хардуер, способен на това, не е жизнеспособен като заместител на двоичните изчисления. Например има т.нар троен компютър, разработен през 50-те години на миналия век, но развитието спря дотук. Троична логика по-ефективен от двоичния, но все още няма ефективен заместител на двоичния транзистор или поне няма транзистор в същия малък мащаб като двоичния.

Причината да не можем да използваме троичната логика се свежда до това как транзисторите са свързани в компютъра и как се използват за математически изчисления. Транзисторът получава информация на два входа, извършва операция и връща резултата на един изход.

По този начин бинарната математика е по-лесна за компютъра от всичко друго. Двоичната логика лесно се преобразува в двоични системи, като True и False съответстват на On и Off състояния.

Двоичната таблица на истината, работеща на двоична логика, ще има четири възможни изхода за всяка фундаментална операция. Но тъй като тройните порти използват три входа, тройната таблица на истината ще има 9 или повече. Докато двоичната система има 16 възможни оператора (2^2^2), троичната система би имала 19683 (3^3^3). Мащабирането се превръща в проблем, защото докато trinity е по-ефективно, то е и експоненциално по-сложно.

Кой знае?В бъдеще може да видим троични компютри, тъй като бинарната логика е изправена пред предизвикателства за миниатюризация. Засега светът ще продължи да работи в двоичен режим.

Може да е полезно да прочетете: