ASCII

תווי ASCII שניתנים להדפסה. כלומר, התווים שיש להם סימן גרפי מקובל. בפינה השמאלית העליונה מופיע סימן המרווח, שהסימן הגרפי שלו הוא מקום ריק. בפינה הימנית התחתונה יש מקום לתו שאין לו סימן גרפי מקובל. מקום זה מופיע בתמונה רק כדי לאפשר הצגה תמציתית של התווים האחרים.

ASCII (ראשי תיבות של: American Standard Code for Information Interchange) הוא קוד לייצוגם של תווים (ספרות, אותיות האלפבית, סימני פיסוק ועוד) בזיכרון מחשב ובקובצי מחשב.

קוד ASCII משמש להצגת אותיות האלפבית הלטיני הפשוט, ללא סימנים דיאקריטיים, המכונים לעיתים אקצנטים. הקוד הוא קידוד תווים של 7 סיביות המכיל 128 תווים, בהם 33 תווי בקרה (אנ') (ירידת שורה, למשל), 52 אותיות, 10 ספרות וסימנים מיוחדים כגון סימני פיסוק וסימן הרווח.

הקוד אינו כולל אותיות בשום אלפבית אחר. בעבר הותאם הקוד לעברית ("קוד ישן") – 27 תווים (כולל אותיות סופיות) תפסו את מקום האותיות הלטיניות הקטנות. גם שפות אחרות הותאמו אליו, למשל עבור גרמנית ויתרו על כמה תווים לטובת יצירת אותיות לטיניות עם סימנים.

כיום תקני ISO מרחיבים תקן זה (בצורתו הבסיסית האמריקאית – לא בצורתו הגרמנית או העברית, למשל), ו־Latin-1, התקן הבסיסי לאנגלית, כולל אותיות לטיניות עם סימנים דיאקריטיים. ISO-8859-8 הוא התקן לעברית המשמש ברוב מערכות המחשב הקיימות.

במרץ 1968 הורה הנשיא לינדון ג'ונסון לסוכנויות פדרליות של ארצות הברית לרכוש אך ורק מחשבים התומכים בקוד ASCII[1]. למשך תקופה מסוימת עוד הייתה ל־ASCII תחרות מצד קוד EBCDIC שפיתחה חברת IBM, אולם עם הזמן ASCII זכתה לעדיפות והייתה לתקן בין-לאומי.

כיום, השימוש ב־ASCII טהור יורד בגלל המעבר ליוניקוד, הכולל אוסף רחב בהרבה של סימנים, ומאפשר ייצוג שפות אחדות במקביל. על אף שישנן תכנות שאינן מתפקדות באופן אופטימלי עם תו שתופס 2 בתים, קיימים תקנים כגון UTF-8 המאפשרים לתווי ה־ASCII לעבור ללא שינוי.

קוד ה-ASCII מוצג לעיתים כטבלה המתאימה בין התו לבין המספר שמיצג אותו ולכן מקובל להתייחס להתאמה בשם: "טבלת ASCII". בטבלת ה-ASCII שלמטה, מופיעים התווים כאשר הערך הבינארי של כל תו מושג על ידי העמודה השמאלית ביותר שמייצגת את שלוש הספרות הבינאריות השמאליות של המספר, ועל ידי השורה העליונה שמייצגת את ארבע הספרות הימניות של המספר. למשל, הייצוג הבינארי של התו "B" הוא "1000010". צבע הרקע הכחול מייצג תו בקרה, צבע הרקע הצהוב מיצג תווים הניתנים להדפסה.

_0000 _0001 _0010 _0011 _0100 _0101 _0110 _0111 _1000 _1001 _1010 _1011 _1100 _1101 _1110 _1111
000_ NUL

[א]

SOH

[תו 1]

STX

[תו 2]

ETX

[תו 3]

EOT

[תו 4]

ENQ

[תו 5]

ACK

[תו 6]

BEL

[תו 7]

BS

[תו 8]

HT

[תו 9]

LF

[תו 10]

VT

[תו 11]

FF

[תו 12]

CR

[תו 13]

CO

[תו 14]

SI

[תו 15]

001_ DLE

[תו 16]

DC1

[תו 17]

DC2

[תו 18]

DC3

[תו 19]

DC4

[תו 20]

NAK

[תו 21]

SYN

[תו 22]

ETB

[תו 23]

CAN

[תו 24]

EM

[תו 25]

SUB

[תו 26]

ESC

[תו 27]

FS

[תו 28]

GS

[תו 29]

RS

[תו 30]

US

[תו 31]

010_ SP

[תו 32]

!

[תו 33]

"

[תו 34]

#

[תו 35]

$

[תו 36]

%

[תו 37]

&

[תו 38]

'

[תו 39]

(

[תו 40]

)

[תו 41]

*

[תו 42]

+

[תו 43]

,

[תו 44]

-

[תו 45]

.

[תו 46]

/

[תו 47]

011_ 0

[תו 48]

1

[תו 49]

2

[תו 50]

3

[תו 51]

4

[תו 52]

5

[תו 53]

6

[תו 54]

7

[תו 55]

8

[תו 56]

9

[תו 57]

:

[תו 58]

;

[תו 59]

<

[תו 60]

=

[תו 61]

>

[תו 62]

?

[תו 63]

100_ @

[תו 64]

A

[תו 65]

B

[תו 66]

C

[תו 67]

D

[תו 68]

E

[תו 69]

F

[תו 70]

G

[תו 71]

H

[תו 72]

I

[תו 73]

J

[תו 74]

K

[תו 75]

L

[תו 76]

M

[תו 77]

N

[תו 78]

O

[תו 79]

101_ P

[תו 80]

Q

[תו 81]

R

[תו 82]

S

[תו 83]

T

[תו 84]

U

[תו 85]

V

[תו 86]

W

[תו 87]

X

[תו 88]

Y

[תו 89]

Z

[תו 90]

[

[תו 91]

\

[תו 92]

]

[תו 93]

^

[תו 94]

_

[תו 95]

110_ `

[תו 96]

a

[תו 97]

b

[תו 98]

c

[תו 99]

d

[תו 100]

e

[תו 101]

f

[תו 102]

g

[תו 103]

h

[תו 104]

i

[תו 105]

j

[תו 106]

k

[תו 107]

l

[תו 108]

m

[תו 109]

n

[תו 110]

o

[תו 111]

111 p

[תו 112]

q

[תו 113]

r

[תו 114]

s

[תו 115]

t

[תו 116]

u

[תו 117]

v

[תו 118]

w

[תו 119]

x

[תו 120]

y

[תו 121]

z

[תו 122]

{

[תו 123]

|

[תו 124]

}

[תו 125]

~

[תו 126]

DEL

[תו 127]


בקוד ASCII הוגדרו רק אותיות אנגליות, גדולות וקטנות. כדי להתאימו לעברית הוחלפו האותיות האנגליות הקטנות באותיות עבריות (בטווח 0x61 עד 0x7A), כך ש-a הוחלפה ל-ב', b הוחלפה ל-ג', וכך הלאה עד z שהוחלפה ל-ת'. כיוון שבאלפבית העברי יש אות אחת יותר מאשר באלפבית האנגלי, קיבלה האות א' את הערך שלפני a, כלומר 0x60. התאמה זו כונתה בהמשך "קוד ישן".

בקוד ASCII מורחב, בן 8 ביטים, בתקן ISO 8859-8 קיבל האלפבית העברי את הטווח 0xE0 עד 0xFA.

ב-Code page 862, אף הוא בן 8 ביטים, קיבל האלפבית העברי את הטווח 0x80 עד 0x9A.

  1. ^ Lyndon B. Johnson, Memorandum Approving the Adoption by the Federal Government of a Standard Code for Information Interchange. The American Presidency Project., March 11, 1968.

Copyright