ANSI એન્કોડિંગ શું છે અને તેનો ઉપયોગ શેની સાથે થાય છે? આલ્કોહોલ કોડિંગ - કિંમતો, પદ્ધતિઓ અને પરિણામો. મદ્યપાન સામે કોડ કેવી રીતે બનાવવો ASCII

સામગ્રી

મદ્યપાન એ એક રોગ છે જે દરેક ત્રીજા વ્યક્તિને અસર કરે છે. આ દુશ્મન સામેની લડાઈ એટલી સરળ નથી જેટલી પહેલી નજરે લાગે છે. ઘણા લોકો મદ્યપાનને સામાન્ય માને છે ખરાબ ટેવ, પરંતુ તેઓ ઊંડે ભૂલમાં છે. આ ડ્રગ્સ જેવું જ છે - વ્યસન વ્યક્તિ પર શાસન કરે છે. આ બધામાંથી કેવી રીતે છુટકારો મેળવવો એ જ પ્રશ્ન છે.

મદ્યપાન માટે કોડ કેવી રીતે બનાવવો

કોડિંગ મદ્યપાન એ વ્યક્તિની ઇચ્છા અને બોટલ પ્રત્યેના આકર્ષણનું દમન છે. મદ્યપાન કરનાર પર અથવા દવાઓની મદદથી મનોવૈજ્ઞાનિક પ્રભાવ દ્વારા બધું થઈ શકે છે. આલ્કોહોલ કોડિંગ કેવી રીતે થાય છે:

વ્યક્તિએ સંપૂર્ણપણે સંમત થવું જોઈએ કે મદ્યપાનથી છુટકારો મેળવવો જરૂરી છે, ડૉક્ટર હંમેશા કોડિંગના તમામ તબક્કાઓ અને ક્ષણો, પરિણામો અને આગળના પરિણામો સમજાવશે;
રક્ત પરીક્ષણ ફરજિયાત છે;
કોડિંગ પદ્ધતિ અને કિંમત દર્દી દ્વારા પસંદ કરવામાં આવે છે;
કોડિંગ કરતા પહેલા, એક અઠવાડિયા માટે આલ્કોહોલ ન પીવો તે મહત્વનું છે જેથી શરીર ઝેરથી પોતાને સાફ કરે;
મદ્યપાન માટે કોડેડ કર્યા પછી, દર્દીને ઉપસ્થિત ચિકિત્સક દ્વારા અવલોકન કરવું આવશ્યક છે.

આલ્કોહોલ કોડિંગના પ્રકાર

સૌથી સામાન્ય કોડિંગ પદ્ધતિઓ દર્દી પર સાયકોથેરાપ્યુટિક દબાણ અને દવાની દરમિયાનગીરી છે. આલ્કોહોલ માટે કોડ કેવી રીતે બનાવવો:

દવાઓ અને દવાઓ. આ કિસ્સામાં, દર્દીને ખાસ દવાઓ સાથે નસમાં ઇન્જેક્ટ કરવામાં આવે છે અને IVs પર મૂકવામાં આવે છે જે શરીરમાંથી આલ્કોહોલ દૂર કરી શકે છે. આ પરિણામો વિના ટાળી શકાતું નથી, તેથી ત્યાં હોઈ શકે છે આડઅસરો. ઉદાહરણ તરીકે, શરીરની સામાન્ય પ્રતિક્રિયા એ આલ્કોહોલિક પીણાં પ્રત્યે સંપૂર્ણ અણગમો છે. આલ્કોહોલ તમને બીમાર લાગશે, પેટમાં દુખાવો થશે - વ્યક્તિને પીણું પીવાથી રોકવા માટે કંઈપણ.
સાયકોથેરાપ્યુટિક હસ્તક્ષેપ અથવા હિપ્નોસિસનો સિદ્ધાંત. આ પદ્ધતિ તે લોકો માટે ભલામણ કરવામાં આવે છે જેમણે નિશ્ચિતપણે નક્કી કર્યું છે કે તેઓ ફરીથી પીશે નહીં અને જેમણે ઇચ્છાશક્તિ વિકસાવી છે. આ કિસ્સામાં, દર્દીને સમાધિની સ્થિતિમાં દાખલ કરીને, ડૉક્ટર વ્યક્તિને સાચા માર્ગ પર "સૂચના" આપે છે. બીજા શબ્દોમાં કહીએ તો, દારૂ પીવાનો ઇનકાર સૂચન દ્વારા રચાય છે.

મદ્યપાન માટે કોડિંગ પદ્ધતિઓ

એવી ઘણી પદ્ધતિઓ છે, વાજબી કિંમતો સાથે, જેનો ઉપયોગ લોકોને મદ્યપાન માટે કોડ કરવા માટે કરવામાં આવે છે. તેમની વચ્ચેનો તફાવત એ છે કે વ્યક્તિ સારવારની પદ્ધતિઓને અલગ રીતે જુએ છે, દરેક પ્રતિક્રિયા વ્યક્તિગત છે. સમીક્ષાઓ અનુસાર, ડોવઝેન્કો પદ્ધતિનો ઉપયોગ કરીને આલ્કોહોલ કોડિંગ પ્રક્રિયા શ્રેષ્ઠ અને સૌથી અસરકારક માનવામાં આવે છે. અહીં સારવારના કેટલાક ફાયદા છે:

આ લડાઈની સૌથી માનવીય અને નૈતિક પદ્ધતિ છે દારૂનું વ્યસનઅને નશામાં;
સમગ્ર અભ્યાસક્રમ દરમિયાન, દર્દીઓને ખ્યાલ આવે છે કે તેમને ખરેખર સારવાર લેવાની અને મદ્યપાનથી છુટકારો મેળવવાની જરૂર છે;
એન્કોડિંગ ક્રિયા પ્રત્યે અણગમો બનાવવામાં મદદ કરે છે આલ્કોહોલિક પીણું, સારવાર પછી દારૂની ગંધ આવે ત્યારે કોઈની પાસે ગેગ રીફ્લેક્સ નથી;
ડોવઝેન્કોની પદ્ધતિ એકદમ હાનિકારક માનવામાં આવે છે, જેનાથી શરીરને ન્યૂનતમ નુકસાન થાય છે;
1 સત્ર પૂરતું છે, કોઈ પુનરાવર્તિત અભ્યાસક્રમોની જરૂર નથી, ત્યાં કોઈ વિરોધાભાસ નથી.

આલ્કોહોલ કોડિંગના પરિણામો

જ્યારે દર્દીએ સમસ્યાને ઉકેલવા માટે ઔષધીય માર્ગ પસંદ કર્યો હોય, ત્યારે કોડિંગના પરિણામો હોઈ શકે છે. ઉદાહરણ તરીકે, દવા માટે શરીરની નકારાત્મક પ્રતિક્રિયા. ઘણા લોકોને ખરાબ લાગે છે કારણ કે અચાનક ઇનકારઆલ્કોહોલથી આખા શરીર માટે તણાવ છે, જે રક્ત વાહિનીઓ અને હૃદય માટે જોખમી છે. આલ્કોહોલ છોડતી વખતે દેખાતા કેટલાક સામાન્ય લક્ષણોમાં નીચેનાનો સમાવેશ થાય છે:

ધ્રુજારી, સતત ધ્રુજારી, ધ્રુજારી;
જઠરાંત્રિય સમસ્યાઓ: ઝાડા, કબજિયાત, ઉલટી, ઉબકા, પેટમાં દુખાવો;
સમસ્યાઓ કાર્ડિયો-વેસ્ક્યુલર સિસ્ટમનું, મજબૂત દબાણમાં વધારો, ઝડપી પલ્સ, કંઠમાળ પેક્ટોરિસ.

જ્યાં દારૂબંધીથી છુટકારો મેળવવો

આલ્કોહોલ કોડિંગ કિંમત

જેઓ આદતથી છૂટકારો મેળવવાની ખૂબ ઈચ્છા ધરાવે છે, પરંતુ તેમની પાસે પૂરતા પૈસા નથી તેમના માટે ખર્ચની બાબત છે. દારૂથી છુટકારો મેળવવા માટે કેટલો ખર્ચ થાય છે? તે બધું પસંદ કરવામાં આવેલી દારૂ-વિરોધી સારવારની પદ્ધતિ, સમયગાળો અને દર્દી જ્યાં ગયો તે ક્લિનિક પર આધાર રાખે છે. અંદાજિત કિંમતો 6,000 થી 30,000 રુબેલ્સ સુધીની છે. તમે ઓનલાઈન સ્ટોરમાં દવાના સસ્તા એમ્પૂલ્સ ખરીદી શકો છો, ડૉક્ટર દ્વારા સૂચવવામાં આવેલી દવાઓનો ઓર્ડર આપી શકો છો, ઉપાડના લક્ષણોમાં રાહત મેળવી શકો છો અને ઘરે જાતે સારવાર કરી શકો છો.

જો તમને કોઈ ટેક્સ્ટ દસ્તાવેજ મોકલવામાં આવે છે જેમાં માહિતી વિચિત્ર અને અગમ્ય અક્ષરોના રૂપમાં પ્રદર્શિત થાય છે, તો તમે ધારી શકો છો કે લેખકે એન્કોડિંગનો ઉપયોગ કર્યો છે જે તમારા કમ્પ્યુટર દ્વારા માન્ય નથી. એન્કોડિંગ બદલવા માટે વિશિષ્ટ ડીકોડર પ્રોગ્રામ્સ છે, પરંતુ ઑનલાઇન સેવાઓમાંથી એકનો ઉપયોગ કરવો ખૂબ સરળ છે.

આજે અમે સૌથી વધુ લોકપ્રિય અને અસરકારક સાઇટ્સ વિશે વાત કરીશું જે તમને એન્કોડિંગનું અનુમાન કરવામાં અને તેને તમારા PC માટે વધુ સમજી શકાય તેવું કંઈક બદલવામાં મદદ કરશે. મોટેભાગે, આવી સાઇટ્સમાં સ્વચાલિત ઓળખ અલ્ગોરિધમ હોય છે, પરંતુ જો જરૂરી હોય તો, વપરાશકર્તા હંમેશા યોગ્ય એન્કોડિંગ જાતે પસંદ કરી શકે છે.

પદ્ધતિ 1: યુનિવર્સલ ડીકોડર

ડીકોડર વપરાશકર્તાઓને સાઈટ પર લખાણના અગમ્ય પેસેજની નકલ કરવા માટે પ્રોત્સાહિત કરે છે અને એન્કોડિંગને આપમેળે વધુ સમજી શકાય તેવા પેસેજમાં રૂપાંતરિત કરે છે. ફાયદાઓમાં સંસાધનની સરળતા, તેમજ વધારાના મેન્યુઅલ સેટિંગ્સની હાજરી શામેલ છે જે તમને સ્વતંત્ર રીતે ઇચ્છિત ફોર્મેટ પસંદ કરવાની મંજૂરી આપે છે.

તમે ફક્ત તે જ ટેક્સ્ટ સાથે કામ કરી શકો છો જેનું કદ 100 કિલોબાઈટથી વધુ ન હોય; વધુમાં, સંસાધનના નિર્માતાઓ બાંહેધરી આપતા નથી કે 100% કેસોમાં ટ્રાન્સકોડિંગ સફળ થશે. જો સંસાધન મદદ કરતું નથી, તો ફક્ત અન્ય પદ્ધતિઓનો ઉપયોગ કરીને ટેક્સ્ટને ઓળખવાનો પ્રયાસ કરો.

મહેરબાની કરીને નોંધ કરો કે જો તમને મોકલાયેલ દસ્તાવેજ પ્રદર્શિત થાય છે «???? ?? ??????» , તે રૂપાંતરિત થવાની શક્યતા નથી. પ્રેષકની ભૂલોને કારણે અક્ષરો દેખાય છે, તેથી ફક્ત ટેક્સ્ટ તમને ફરીથી મોકલવા માટે પૂછો.

પદ્ધતિ 2: આર્ટેમી લેબેડેવ સ્ટુડિયો

એન્કોડિંગ સાથે કામ કરવા માટેની બીજી સાઇટ, અગાઉના સંસાધનથી વિપરીત, વધુ સુખદ ડિઝાઇન ધરાવે છે. તે વપરાશકર્તાઓને ઓપરેશનના બે મોડ ઓફર કરે છે, સરળ અને અદ્યતન, પ્રથમ કિસ્સામાં, ડીકોડિંગ પછી, વપરાશકર્તા પરિણામ જુએ છે, બીજા કિસ્સામાં, પ્રારંભિક અને અંતિમ એન્કોડિંગ દૃશ્યમાન છે.

સાઇટ સાથે, પ્રતીકોની કોઈપણ અગમ્ય ગડબડ ઝડપથી સમજી શકાય તેવા રશિયન ટેક્સ્ટમાં ફેરવાય છે. આ ક્ષણે સંસાધન બધા જાણીતા એન્કોડિંગ્સ સાથે કામ કરે છે.

પદ્ધતિ 3: ફોક્સ ટૂલ્સ

ફોક્સ ટૂલ્સ નિયમિત રશિયન ટેક્સ્ટમાં અગમ્ય અક્ષરોના સાર્વત્રિક ડીકોડિંગ માટે રચાયેલ છે. વપરાશકર્તા સ્વતંત્ર રીતે પ્રારંભ અને અંત એન્કોડિંગ પસંદ કરી શકે છે; સાઇટમાં સ્વચાલિત મોડ પણ છે.

એ હકીકત હોવા છતાં કે સાઇટ કથિત રીતે એન્કોડિંગને આપમેળે ઓળખે છે, વપરાશકર્તાએ હજી પણ સ્પષ્ટ પરિણામ જાતે જ પસંદ કરવું પડશે. આ સુવિધાને લીધે, ઉપર વર્ણવેલ પદ્ધતિઓનો ઉપયોગ કરવો વધુ સરળ છે.

ANSI વિન્ડોઝ એન્કોડિંગ શું છે તે પ્રશ્નનો જવાબ આપતા પહેલા, ચાલો પહેલા બીજા પ્રશ્નનો જવાબ આપીએ: "સામાન્ય રીતે એન્કોડિંગ શું છે?"

દરેક કોમ્પ્યુટર, દરેક સિસ્ટમ તેના પર વપરાશકર્તા દ્વારા વપરાતી ભાષાના આધારે અક્ષરોના ચોક્કસ સમૂહનો ઉપયોગ કરે છે વ્યાવસાયિક કુશળતાઅને વ્યક્તિગત પસંદગીઓ.

એન્કોડિંગની સામાન્ય વ્યાખ્યા

આમ, રશિયનમાં, 33 પ્રતીકોનો ઉપયોગ અક્ષરો સૂચવવા માટે થાય છે, અંગ્રેજીમાં - 26. ગણતરી માટે 10 અંકોનો પણ ઉપયોગ થાય છે (0; 1; 2; 3; 4; 5; 6; 7; 8; 9) અને કેટલાક ખાસ પ્રતીકો, બાદબાકી, જગ્યા, બિંદુ, ટકાવારી અને તેથી વધુ.

આમાંના દરેક અક્ષરોને કોડ ટેબલનો ઉપયોગ કરીને સીરીયલ નંબર અસાઇન કરવામાં આવે છે. ઉદાહરણ તરીકે, અક્ષર "A" ને નંબર 1 સોંપવામાં આવી શકે છે; "Z" - 26 અને તેથી વધુ.

વાસ્તવમાં, અક્ષરને પૂર્ણાંક તરીકે રજૂ કરતી સંખ્યાને અક્ષર કોડ ગણવામાં આવે છે, અને એન્કોડિંગ, તે મુજબ, આવા કોષ્ટકમાં અક્ષરોનો સમૂહ છે.

કોડ કોષ્ટકોની સમૃદ્ધ વિવિધતા

આ ક્ષણે, વિવિધ નિષ્ણાતો દ્વારા ઉપયોગમાં લેવાતા એન્કોડિંગ્સ અને કોડ કોષ્ટકોની ખૂબ મોટી સંખ્યા છે: આ ASCII છે, જે અમેરિકામાં 1963 માં વિકસાવવામાં આવી હતી, અને Windows-1251, જે તાજેતરમાં માઇક્રોસોફ્ટ, KOI8-R અને Guobiao ને કારણે લોકપ્રિય હતી - અને ઘણા, અન્ય ઘણા, અને તેમના દેખાવ અને મૃત્યુની પ્રક્રિયા આજ સુધી ચાલુ છે.

આ વિશાળ સૂચિમાં, કહેવાતા ANSI એન્કોડિંગ ખાસ કરીને બહાર આવે છે.

હકીકત એ છે કે એક સમયે માઇક્રોસોફ્ટે કોડ પૃષ્ઠોનો સંપૂર્ણ સેટ બનાવ્યો હતો:

તે બધાને સામૂહિક રીતે ANSI એન્કોડિંગ ટેબલ અથવા ANSI કોડ પેજ કહેવામાં આવે છે.

રસપ્રદ તથ્ય: પ્રથમ કોડ કોષ્ટકોમાંનું એક ASCII હતું, જે અમેરિકન નેશનલ સ્ટાન્ડર્ડ ઇન્સ્ટિટ્યૂટ દ્વારા 1963માં બનાવવામાં આવ્યું હતું, જેને ANSI તરીકે સંક્ષિપ્તમાં ઓળખવામાં આવે છે.

અન્ય વસ્તુઓની સાથે, આ એન્કોડિંગમાં બિન-છાપવા યોગ્ય અક્ષરો પણ છે, કહેવાતા "એસ્કેપ સિક્વન્સીસ", અથવા ESC, જે તમામ અક્ષર કોષ્ટકો માટે અનન્ય છે અને ઘણીવાર એકબીજા સાથે અસંગત હોય છે. જ્યારે કુશળતાપૂર્વક ઉપયોગ કરવામાં આવે છે, તેમ છતાં, તેઓ તમને કર્સરને છુપાવવા અને પુનઃસ્થાપિત કરવાની મંજૂરી આપે છે, તેને ટેક્સ્ટમાં એક સ્થાનેથી બીજી સ્થિતિમાં ખસેડી શકે છે, ટૅબ્સ સેટ કરી શકે છે, ટર્મિનલ વિંડોનો ભાગ ભૂંસી નાખે છે જેમાં તમે કામ કરતા હતા, સ્ક્રીન પર ટેક્સ્ટનું ફોર્મેટિંગ બદલવાની અને રંગ બદલો (અથવા ધ્વનિ સંકેતો દોરો અને સર્વ કરો!). 1976 માં, માર્ગ દ્વારા, પ્રોગ્રામરો માટે આ એક ખૂબ સારી મદદ હતી. માર્ગ દ્વારા, ટર્મિનલ એ માહિતીના ઇનપુટ અને આઉટપુટ માટે જરૂરી ઉપકરણ છે. તે દૂરના સમયમાં, તે કમ્પ્યુટર (ઇલેક્ટ્રોનિક કમ્પ્યુટર) સાથે જોડાયેલ મોનિટર અને કીબોર્ડ હતું.

અક્ષરોનું ખોટું પ્રદર્શન

કમનસીબે, ભવિષ્યમાં, આવી સિસ્ટમને કારણે સિસ્ટમમાં અસંખ્ય નિષ્ફળતાઓ આવી, જે ઇચ્છિત કવિતાઓ, સમાચાર ફીડ્સ અથવા પ્રિયજનોના વર્ણનને બદલે પ્રદર્શિત કરે છે. કમ્પ્યુટર રમતો krakozyabry કહેવાતા - અર્થહીન, વાંચી ન શકાય તેવા અક્ષર સમૂહો. આ સર્વવ્યાપક ભૂલો માત્ર એક કોડ ટેબલમાં બીજા કોડનો ઉપયોગ કરીને એન્કોડ કરેલા અક્ષરોને પ્રદર્શિત કરવાનો પ્રયાસ કરવાથી થઈ હતી.

મોટાભાગે, અમે હજી પણ ઇન્ટરનેટ પર આ એન્કોડિંગના ખોટા વાંચનના પરિણામોનો સામનો કરીએ છીએ, જ્યારે અમારું બ્રાઉઝર કોઈ કારણસર ચોક્કસપણે નિર્ધારિત કરી શકતું નથી કે વેબની સૂચનાઓને કારણે હાલમાં કયા Windows **** એન્કોડિંગ્સનો ઉપયોગ થઈ રહ્યો છે. સામાન્ય ANSI એન્કોડિંગનો માસ્ટર અથવા પ્રારંભિક રીતે ખોટો એન્કોડિંગ, ઉદાહરણ તરીકે, 1521 ને બદલે 1252. નીચે ચોક્કસ એન્કોડિંગ કોષ્ટક છે.

સિરિલિક ANSI એન્કોડિંગ ટેબલ, Windows-1251

તદુપરાંત, 1986 માં, ANSI નો નોંધપાત્ર રીતે વિસ્તરણ કરવામાં આવ્યો, ઇયાન ઇ. ડેવિસને આભારી, જેમણે ધ ડ્રો પેકેજ લખ્યું, જે તમને ફક્ત મૂળભૂત, અમારા દૃષ્ટિકોણથી, કાર્યોનો ઉપયોગ કરવા માટે જ નહીં, પણ સંપૂર્ણ રીતે (અથવા લગભગ સંપૂર્ણ) ઉપયોગ કરવાની મંજૂરી આપે છે. દોરો

સારાંશ

આમ, તમે જોઈ શકો છો કે ANSI એન્કોડિંગ, હકીકતમાં, જો કે તે એક વિવાદાસ્પદ નિર્ણય હતો, તેની સ્થિતિ જાળવી રાખે છે.

સમય જતાં, ઉત્સાહીઓની મદદથી, પ્રાચીન ANSI ટર્મિનલ પણ ટેલિફોન પર સ્થાનાંતરિત થયું!

હેલો, બ્લોગ સાઇટના પ્રિય વાચકો. આજે અમે તમારી સાથે વેબસાઈટ પર અને પ્રોગ્રામમાં ક્રાકોઝ્યાબર્સ ક્યાંથી આવે છે, કયા ટેક્સ્ટ એન્કોડિંગ્સ અસ્તિત્વમાં છે અને કયાનો ઉપયોગ કરવો જોઈએ તે વિશે વાત કરીશું. ચાલો મૂળભૂત ASCII, તેમજ તેના વિસ્તૃત સંસ્કરણો CP866, KOI8-R, Windows 1251 થી શરૂ કરીને અને આધુનિક યુનિકોડ કન્સોર્ટિયમ એન્કોડિંગ્સ UTF 16 અને 8 સાથે સમાપ્ત થતા તેમના વિકાસના ઇતિહાસ પર નજીકથી નજર કરીએ.

કેટલાકને, આ માહિતી બિનજરૂરી લાગી શકે છે, પરંતુ શું તમે જાણશો કે મને ખાસ કરીને ક્રોલિંગ ક્રેકોઝ્યાબ્ર્સ (અક્ષરોનો વાંચી ન શકાય તેવા સમૂહ) વિશે કેટલા પ્રશ્નો પ્રાપ્ત થયા છે. હવે મને દરેકને આ લેખના ટેક્સ્ટનો સંદર્ભ લેવાની અને મારી પોતાની ભૂલો શોધવાની તક મળશે. સારું, માહિતીને ગ્રહણ કરવા માટે તૈયાર થાઓ અને વાર્તાના પ્રવાહને અનુસરવાનો પ્રયાસ કરો.

ASCII - લેટિન મૂળાક્ષરો માટે મૂળભૂત ટેક્સ્ટ એન્કોડિંગ

આઇટી ઉદ્યોગની રચના સાથે ટેક્સ્ટ એન્કોડિંગ્સનો વિકાસ એક સાથે થયો, અને આ સમય દરમિયાન તેઓ ઘણા બધા ફેરફારોમાંથી પસાર થયા. ઐતિહાસિક રીતે, તે બધું EBCDIC થી શરૂ થયું હતું, જે રશિયન ઉચ્ચારણમાં અસંતુષ્ટ હતું, જેણે લેટિન મૂળાક્ષરોના અક્ષરો, અરબી અંકો અને નિયંત્રણ અક્ષરો સાથે વિરામચિહ્નોને એન્કોડ કરવાનું શક્ય બનાવ્યું હતું.

પરંતુ તેમ છતાં, આધુનિક ટેક્સ્ટ એન્કોડિંગ્સના વિકાસ માટેનો પ્રારંભિક બિંદુ પ્રખ્યાત ગણવો જોઈએ ASCII(અમેરિકન સ્ટાન્ડર્ડ કોડ ફોર ઇન્ફોર્મેશન ઇન્ટરચેન્જ, જે સામાન્ય રીતે રશિયનમાં "પૂછો" તરીકે ઉચ્ચારવામાં આવે છે). તે અંગ્રેજી બોલતા વપરાશકર્તાઓ દ્વારા સામાન્ય રીતે ઉપયોગમાં લેવાતા પ્રથમ 128 અક્ષરોનું વર્ણન કરે છે - , અરબી અંકો અને વિરામચિહ્નો.

ASCII માં વર્ણવેલ આ 128 અક્ષરોમાં કૌંસ, હેશ માર્ક્સ, ફૂદડી વગેરે જેવા કેટલાક સેવા અક્ષરોનો પણ સમાવેશ થાય છે. હકીકતમાં, તમે તેમને જાતે જોઈ શકો છો:

તે ASCII ના મૂળ સંસ્કરણના આ 128 અક્ષરો છે જે પ્રમાણભૂત બની ગયા છે, અને કોઈપણ અન્ય એન્કોડિંગમાં તમે ચોક્કસપણે તેમને શોધી શકશો અને તેઓ આ ક્રમમાં દેખાશે.

પરંતુ હકીકત એ છે કે માહિતીના એક બાઈટથી તમે 128 નહીં, પરંતુ 256 જેટલા વિવિધ મૂલ્યો (બેથી આઠની શક્તિ 256 બરાબર) એન્કોડ કરી શકો છો, તેથી અસુકાના મૂળભૂત સંસ્કરણ પછી આખી શ્રેણી વિસ્તૃત ASCII એન્કોડિંગ્સ, જેમાં, 128 મૂળભૂત અક્ષરો ઉપરાંત, રાષ્ટ્રીય એન્કોડિંગના પ્રતીકોને એન્કોડ કરવાનું પણ શક્ય હતું (ઉદાહરણ તરીકે, રશિયન).

અહીં, વર્ણનમાં ઉપયોગમાં લેવાતી સંખ્યા સિસ્ટમો વિશે થોડું વધુ કહેવું યોગ્ય છે. સૌપ્રથમ, જેમ તમે બધા જાણો છો, કમ્પ્યુટર ફક્ત દ્વિસંગી સિસ્ટમમાં સંખ્યાઓ સાથે કામ કરે છે, જેમ કે શૂન્ય અને એક સાથે ("બુલિયન બીજગણિત", જો કોઈ તેને સંસ્થા અથવા શાળામાં લેતું હોય). , જેમાંથી પ્રત્યેક શક્તિ માટે બે છે, શૂન્યથી શરૂ થાય છે, અને બેથી સાતમા સુધી:

તે સમજવું મુશ્કેલ નથી કે આવી ડિઝાઇનમાં શૂન્ય અને રાશિઓના તમામ સંભવિત સંયોજનો માત્ર 256 જ હોઈ શકે છે. સંખ્યાને દ્વિસંગી સિસ્ટમમાંથી દશાંશ પદ્ધતિમાં રૂપાંતરિત કરવી એકદમ સરળ છે. તમારે ફક્ત બેની બધી શક્તિઓ તેમની ઉપરની સાથે ઉમેરવાની જરૂર છે.

અમારા ઉદાહરણમાં, આ 1 (શૂન્યની ઘાતની 2) વત્તા 8 (3ની ઘાતની બે), વત્તા 32 (બેની પાંચમી ઘાત), વત્તા 64 (છઠ્ઠી ઘાતની), વત્તા 128 થાય છે. (સાતમી શક્તિ સુધી). દશાંશ સંકેતમાં કુલ 233 છે. જેમ તમે જોઈ શકો છો, બધું ખૂબ સરળ છે.

પરંતુ જો તમે ASCII અક્ષરો સાથેના કોષ્ટકને નજીકથી જોશો, તો તમે જોશો કે તેઓ હેક્સાડેસિમલ એન્કોડિંગમાં રજૂ થાય છે. ઉદાહરણ તરીકે, "ફૂદડી" એસ્કીમાં હેક્સાડેસિમલ નંબર 2A ને અનુલક્ષે છે. તમે કદાચ જાણો છો કે હેક્સાડેસિમલ નંબર સિસ્ટમમાં, સિવાય અરબી અંકો A (એટલે દસ) થી F (એટલે પંદર) સુધીના લેટિન અક્ષરો પણ.

સારું પછી, માટે દ્વિસંગી સંખ્યાને હેક્સાડેસિમલમાં રૂપાંતરિત કરવીનીચેની સરળ અને સ્પષ્ટ પદ્ધતિનો આશરો લો. ઉપરના સ્ક્રીનશોટમાં બતાવ્યા પ્રમાણે માહિતીના દરેક બાઈટને ચાર બિટ્સના બે ભાગમાં વહેંચવામાં આવે છે. તે. દરેક હાફ બાઇટમાં, માત્ર સોળ મૂલ્યો (બેથી ચોથા પાવર)ને બાઈનરીમાં એન્કોડ કરી શકાય છે, જેને હેક્સાડેસિમલ નંબર તરીકે સરળતાથી રજૂ કરી શકાય છે.

તદુપરાંત, બાઈટના ડાબા અડધા ભાગમાં ડિગ્રીને શૂન્યથી શરૂ કરીને ફરીથી ગણવાની જરૂર પડશે, અને સ્ક્રીનશોટમાં બતાવ્યા પ્રમાણે નહીં. પરિણામે, સરળ ગણતરીઓ દ્વારા, અમે મેળવીએ છીએ કે સ્ક્રીનશોટમાં E9 નંબર એન્કોડેડ છે. હું આશા રાખું છું કે મારા તર્કનો કોર્સ અને આ કોયડાનો ઉકેલ તમને સ્પષ્ટ હતો. સારું, હવે ચાલો ચાલુ રાખીએ, હકીકતમાં, ટેક્સ્ટ એન્કોડિંગ્સ વિશે વાત કરીએ.

સ્યુડોગ્રાફિક્સ સાથે અસુકા - CP866 અને KOI8-R એન્કોડિંગ્સની વિસ્તૃત આવૃત્તિઓ

તેથી, અમે ASCII વિશે વાત કરવાનું શરૂ કર્યું, જે હતું, જેમ કે, તમામ આધુનિક એન્કોડિંગ્સ (Windows 1251, Unicode, UTF 8) ના વિકાસ માટે પ્રારંભિક બિંદુ.

શરૂઆતમાં, તેમાં લેટિન મૂળાક્ષરોના ફક્ત 128 અક્ષરો, અરબી અંકો અને બીજું કંઈક હતું, પરંતુ વિસ્તૃત સંસ્કરણમાં તે તમામ 256 મૂલ્યોનો ઉપયોગ કરવાનું શક્ય બન્યું જે માહિતીના એક બાઈટમાં એન્કોડ કરી શકાય છે. તે. અસ્કીમાં તમારી ભાષાના અક્ષરોના પ્રતીકો ઉમેરવાનું શક્ય બન્યું.

અહીં આપણે સમજાવવા માટે ફરીથી વિષયાંતર કરવાની જરૂર પડશે - આપણને એન્કોડિંગ્સની જરૂર કેમ છે?પાઠો અને શા માટે તે ખૂબ મહત્વનું છે. તમારી કમ્પ્યુટર સ્ક્રીન પરના અક્ષરો બે વસ્તુઓના આધારે રચાય છે - વિવિધ અક્ષરોના વેક્ટર સ્વરૂપો (પ્રતિનિધિત્વ) (તેઓ સાથેની ફાઇલોમાં સ્થિત છે) અને કોડ કે જે તમને વેક્ટર સ્વરૂપોના આ સમૂહ (ફોન્ટ ફાઇલ)માંથી બહાર કાઢવાની મંજૂરી આપે છે. ) બરાબર અક્ષર કે જે યોગ્ય જગ્યાએ દાખલ કરવાની જરૂર પડશે.

તે સ્પષ્ટ છે કે ફોન્ટ્સ પોતે વેક્ટર આકાર માટે જવાબદાર છે, પરંતુ ઓપરેટિંગ સિસ્ટમ અને તેમાં વપરાતા પ્રોગ્રામ્સ એન્કોડિંગ માટે જવાબદાર છે. તે. તમારા કમ્પ્યુટર પરનો કોઈપણ ટેક્સ્ટ બાઈટનો સમૂહ હશે, જેમાંથી દરેક આ જ ટેક્સ્ટના એક અક્ષરને એન્કોડ કરે છે.

પ્રોગ્રામ કે જે આ ટેક્સ્ટને સ્ક્રીન પર પ્રદર્શિત કરે છે (ટેક્સ્ટ એડિટર, બ્રાઉઝર, વગેરે), જ્યારે કોડને પાર્સ કરે છે, ત્યારે આગલા અક્ષરનું એન્કોડિંગ વાંચે છે અને જરૂરી ફોન્ટ ફાઇલમાં અનુરૂપ વેક્ટર ફોર્મ શોધે છે, જે આને પ્રદર્શિત કરવા માટે જોડાયેલ છે. ટેક્સ્ટ દસ્તાવેજ. બધું સરળ અને મામૂલી છે.

આનો અર્થ એ છે કે આપણને જોઈતા કોઈપણ અક્ષરને એન્કોડ કરવા માટે (ઉદાહરણ તરીકે, રાષ્ટ્રીય મૂળાક્ષરોમાંથી), બે શરતો પૂરી કરવી આવશ્યક છે - આ અક્ષરનું વેક્ટર સ્વરૂપ ઉપયોગમાં લેવાતા ફોન્ટમાં હોવું જોઈએ અને આ અક્ષરને વિસ્તૃત ASCII એન્કોડિંગમાં એન્કોડ કરી શકાય છે. એક બાઈટ. તેથી, આવા વિકલ્પોનો સંપૂર્ણ સમૂહ છે. ફક્ત રશિયન ભાષાના અક્ષરોને એન્કોડ કરવા માટે, વિસ્તૃત આસ્કાની ઘણી જાતો છે.

ઉદાહરણ તરીકે, મૂળ દેખાયા CP866, જેમાં રશિયન મૂળાક્ષરોમાંથી અક્ષરોનો ઉપયોગ કરવાની ક્ષમતા હતી અને તે ASCII નું વિસ્તૃત સંસ્કરણ હતું.

તે. તેનો ઉપલા ભાગ સંપૂર્ણપણે અસ્કાના મૂળભૂત સંસ્કરણ (128 લેટિન અક્ષરો, સંખ્યાઓ અને અન્ય વાહિયાત) સાથે એકરુપ છે, જે ફક્ત ઉપરના સ્ક્રીનશૉટમાં રજૂ કરવામાં આવ્યો છે, પરંતુ CP866 એન્કોડિંગ સાથેના કોષ્ટકનો નીચેનો ભાગ સ્ક્રીનશોટમાં દર્શાવેલ દેખાવ હતો. અને તમને બીજા 128 ચિહ્નો (રશિયન અક્ષરો અને તમામ પ્રકારના સ્યુડોગ્રાફિક્સ) એન્કોડ કરવાની મંજૂરી આપી:

તમે જુઓ, જમણી કોલમમાં સંખ્યાઓ 8 થી શરૂ થાય છે, કારણ કે... 0 થી 7 સુધીની સંખ્યાઓ ASCII ના મૂળભૂત ભાગનો સંદર્ભ આપે છે (પ્રથમ સ્ક્રીનશોટ જુઓ). તે. CP866 માં રશિયન અક્ષર "M" માં કોડ 9C હશે (તે 9 સાથે સંબંધિત પંક્તિના આંતરછેદ પર સ્થિત છે અને હેક્સાડેસિમલ નંબર સિસ્ટમમાં નંબર C સાથે કૉલમ છે), જે માહિતીના એક બાઈટમાં લખી શકાય છે, અને જો ત્યાં રશિયન અક્ષરો સાથે યોગ્ય ફોન્ટ છે, તો સમસ્યા વિનાનો આ અક્ષર ટેક્સ્ટમાં દેખાશે.

આ રકમ ક્યાંથી આવી? CP866 માં સ્યુડોગ્રાફિક્સ? આખો મુદ્દો એ છે કે રશિયન ટેક્સ્ટ માટેનું આ એન્કોડિંગ તે અસ્પષ્ટ વર્ષોમાં વિકસાવવામાં આવ્યું હતું જ્યારે ગ્રાફિકલ ઑપરેટિંગ સિસ્ટમ્સ હવે જેટલી વ્યાપક ન હતી. અને ડોસા અને સમાન ટેક્સ્ટ ઓપરેટિંગ સિસ્ટમ્સમાં, સ્યુડોગ્રાફિક્સે ઓછામાં ઓછા કોઈક રીતે ટેક્સ્ટની ડિઝાઇનમાં વિવિધતા લાવવાનું શક્ય બનાવ્યું, અને તેથી CP866 અને અસુકાના વિસ્તૃત સંસ્કરણોની શ્રેણીમાંથી તેના અન્ય તમામ સાથીદારો તેમાં વિપુલ પ્રમાણમાં છે.

CP866 IBM દ્વારા વિતરિત કરવામાં આવ્યું હતું, પરંતુ આ ઉપરાંત, રશિયન ભાષાના અક્ષરો માટે સંખ્યાબંધ એન્કોડિંગ્સ વિકસાવવામાં આવ્યા હતા, ઉદાહરણ તરીકે, સમાન પ્રકાર (વિસ્તૃત ASCII) એટ્રિબ્યુટ કરી શકાય છે. KOI8-R:

તેના ઓપરેશનનો સિદ્ધાંત થોડો અગાઉ વર્ણવેલ CP866 જેવો જ રહે છે - ટેક્સ્ટના દરેક અક્ષરને એક સિંગલ બાઈટ દ્વારા એન્કોડ કરવામાં આવે છે. સ્ક્રીનશોટ KOI8-R કોષ્ટકનો બીજો ભાગ બતાવે છે, કારણ કે પ્રથમ અર્ધ મૂળભૂત અસુકા સાથે સંપૂર્ણપણે સુસંગત છે, જે આ લેખના પ્રથમ સ્ક્રીનશૉટમાં બતાવવામાં આવ્યું છે.

KOI8-R એન્કોડિંગની વિશેષતાઓમાં, તે નોંધી શકાય છે કે તેના કોષ્ટકમાં રશિયન અક્ષરો મૂળાક્ષરોના ક્રમમાં નથી, ઉદાહરણ તરીકે, તેઓએ તેને CP866 માં કર્યું.

જો તમે પ્રથમ સ્ક્રીનશૉટ (મૂળભૂત ભાગનો, જે તમામ વિસ્તૃત એન્કોડિંગ્સમાં શામેલ છે) જોશો, તો તમે જોશો કે KOI8-R માં રશિયન અક્ષરો લેટિન મૂળાક્ષરોના અનુરૂપ અક્ષરો જેવા કોષ્ટકના સમાન કોષોમાં સ્થિત છે. કોષ્ટકના પ્રથમ ભાગમાંથી. આ માત્ર એક બીટ (બે થી સાતમી શક્તિ અથવા 128) કાઢીને રશિયનમાંથી લેટિન અક્ષરોમાં સ્વિચ કરવાની સુવિધા માટે કરવામાં આવ્યું હતું.

વિન્ડોઝ 1251 - ASCII નું આધુનિક સંસ્કરણ અને શા માટે તિરાડો બહાર આવે છે

ટેક્સ્ટ એન્કોડિંગ્સનો વધુ વિકાસ એ હકીકતને કારણે હતો કે ગ્રાફિકલ ઓપરેટિંગ સિસ્ટમ્સ લોકપ્રિયતા મેળવી રહી હતી અને સમય જતાં તેમાં સ્યુડોગ્રાફિક્સનો ઉપયોગ કરવાની જરૂરિયાત અદૃશ્ય થઈ ગઈ હતી. પરિણામે, એક આખું જૂથ ઊભું થયું કે, સારમાં, હજુ પણ અસુકાની વિસ્તૃત આવૃત્તિઓ હતી (ટેક્સ્ટનું એક અક્ષર માત્ર એક બાઈટ માહિતી સાથે એન્કોડ કરવામાં આવે છે), પરંતુ સ્યુડોગ્રાફિક પ્રતીકોનો ઉપયોગ કર્યા વિના.

તેઓ કહેવાતા ANSI એન્કોડિંગ્સના હતા, જે અમેરિકન સ્ટાન્ડર્ડ ઇન્સ્ટિટ્યૂટ દ્વારા વિકસાવવામાં આવ્યા હતા. સામાન્ય ભાષામાં, સિરિલિક નામનો ઉપયોગ રશિયન ભાષાના સમર્થન સાથેના સંસ્કરણ માટે પણ થતો હતો. આનું ઉદાહરણ હશે.

તે અગાઉ વપરાતા CP866 અને KOI8-R થી અનુકૂળ રીતે અલગ હતું કે તેમાં સ્યુડોગ્રાફિક પ્રતીકોનું સ્થાન રશિયન ટાઇપોગ્રાફીના ગુમ થયેલ પ્રતીકો (ઉચ્ચારણ ચિહ્ન સિવાય), તેમજ નજીકની સ્લેવિક ભાષાઓમાં વપરાતા પ્રતીકો દ્વારા લેવામાં આવ્યું હતું. રશિયન (યુક્રેનિયન, બેલારુસિયન, વગેરે). ):

રશિયન ભાષાના એન્કોડિંગ્સ, ફોન્ટ ઉત્પાદકો અને ઉત્પાદકોની આવી વિપુલતાને કારણે સોફ્ટવેરસતત ઊભો થયો માથાનો દુખાવો, અને તમે અને હું, પ્રિય વાચકો, ઘણીવાર તે જ કુખ્યાત બહાર નીકળી ગયા krakozyabryજ્યારે ટેક્સ્ટમાં વપરાયેલ સંસ્કરણ સાથે મૂંઝવણ હતી.

ઈ-મેલ દ્વારા સંદેશાઓ મોકલતી અને પ્રાપ્ત કરતી વખતે ઘણી વાર તેઓ બહાર આવતા હતા, જેમાં ખૂબ જ જટિલ રૂપાંતરણ કોષ્ટકોની રચના કરવામાં આવી હતી, જે હકીકતમાં, આ સમસ્યાને મૂળભૂત રીતે હલ કરી શકતી નથી, અને વપરાશકર્તાઓ વારંવાર ઉપયોગ કરતી વખતે કુખ્યાત યુક્તિઓને ટાળવા માટે પત્રવ્યવહાર માટે ઉપયોગમાં લેતા હતા. CP866, KOI8-R અથવા Windows 1251 જેવા રશિયન એન્કોડિંગ્સ.

વાસ્તવમાં, રશિયન લખાણને બદલે ક્રેકોઝ્યાબ્ર્સ દેખાય છે તે એન્કોડિંગના ખોટા ઉપયોગનું પરિણામ હતું. આ ભાષાની, જે એક સાથે મેળ ખાતી નથી જેમાં ટેક્સ્ટ સંદેશ મૂળ રીતે એન્કોડ કરવામાં આવ્યો હતો.

ચાલો કહીએ કે જો તમે Windows 1251 કોડ ટેબલનો ઉપયોગ કરીને CP866 નો ઉપયોગ કરીને એન્કોડ કરેલા અક્ષરો પ્રદર્શિત કરવાનો પ્રયાસ કરો છો, તો આ જ ગબ્બરિશ (અક્ષરોનો અર્થહીન સમૂહ) સંદેશના ટેક્સ્ટને સંપૂર્ણપણે બદલીને બહાર આવશે.

ફોરમ અથવા બ્લોગ્સમાં ઘણી વાર આવી જ પરિસ્થિતિ ઊભી થાય છે, જ્યારે રશિયન અક્ષરો સાથેનો ટેક્સ્ટ ભૂલથી સાઇટ પર ઉપયોગમાં લેવાતા ખોટા એન્કોડિંગમાં સાચવવામાં આવે છે જે ડિફૉલ્ટ રૂપે અથવા ખોટા ટેક્સ્ટ એડિટરમાં હોય છે, જે દૃશ્યમાન ન હોય તેવા કોડમાં ગેગ્સ ઉમેરે છે. નગ્ન આંખ.

અંતે, ઘણા લોકો ઘણા બધા એન્કોડિંગ્સ સાથે આ પરિસ્થિતિથી કંટાળી ગયા હતા અને સતત બકવાસ બહાર કાઢતા હતા, અને એક નવી સાર્વત્રિક વિવિધતાની રચના માટે પૂર્વજરૂરીયાતો દેખાઈ હતી જે તમામ અસ્તિત્વમાંનાને બદલશે અને છેવટે દેખાવ સાથે સમસ્યા હલ કરશે. વાંચી ન શકાય તેવા પાઠો. આ ઉપરાંત, ચાઇનીઝ જેવી ભાષાઓની સમસ્યા હતી, જ્યાં 256 કરતા વધુ ભાષાના અક્ષરો હતા.

યુનિકોડ - યુનિવર્સલ એન્કોડિંગ્સ UTF 8, 16 અને 32

આ હજારો ચિહ્નો ભાષા જૂથદક્ષિણપૂર્વ એશિયાને માહિતીના એક બાઈટમાં વર્ણવી શકાયું નથી, જે ASCII ના વિસ્તૃત સંસ્કરણોમાં એન્કોડિંગ અક્ષરો માટે ફાળવવામાં આવ્યું હતું. પરિણામે, એક કન્સોર્ટિયમ બનાવવામાં આવ્યું હતું જેને બોલાવવામાં આવ્યું હતું યુનિકોડ(યુનિકોડ - યુનિકોડ કન્સોર્ટિયમ) ઘણા IT ઉદ્યોગના નેતાઓના સહયોગથી (જેઓ સોફ્ટવેરનું ઉત્પાદન કરે છે, જેઓ હાર્ડવેરને એન્કોડ કરે છે, જેઓ ફોન્ટ્સ બનાવે છે), જેઓ સાર્વત્રિક ટેક્સ્ટ એન્કોડિંગના ઉદભવમાં રસ ધરાવતા હતા.

યુનિકોડ કન્સોર્ટિયમના આશ્રય હેઠળ બહાર પાડવામાં આવેલ પ્રથમ વિવિધતા હતી UTF 32. એન્કોડિંગ નામની સંખ્યાનો અર્થ એ છે કે બિટ્સની સંખ્યા જેનો ઉપયોગ એક અક્ષરને એન્કોડ કરવા માટે થાય છે. નવા સાર્વત્રિક UTF એન્કોડિંગમાં એક સિંગલ કેરેક્ટરને એન્કોડ કરવા માટે જરૂરી 32 બિટ્સ માહિતીના 4 બાઇટ્સ સમાન છે.

પરિણામે, ASCII ના વિસ્તૃત સંસ્કરણ અને UTF-32 માં એન્કોડ કરેલી ટેક્સ્ટ સાથેની સમાન ફાઇલ, પછીના કિસ્સામાં, ચાર ગણી મોટી હશે. આ ખરાબ છે, પરંતુ હવે અમારી પાસે YTF નો ઉપયોગ કરીને બે થી ત્રીસ-સેકન્ડ પાવર ( અબજો અક્ષરો, જે પ્રચંડ માર્જિન સાથે કોઈપણ ખરેખર જરૂરી મૂલ્યને આવરી લેશે).

પરંતુ યુરોપિયન જૂથની ભાષાઓ ધરાવતા ઘણા દેશોએ એન્કોડિંગમાં આટલી મોટી સંખ્યામાં અક્ષરોનો ઉપયોગ કરવાની જરૂર નહોતી, જો કે, UTF-32 નો ઉપયોગ કરતી વખતે, તેઓને કોઈ કારણસર ટેક્સ્ટ દસ્તાવેજોના વજનમાં ચાર ગણો વધારો મળ્યો નથી, અને પરિણામે, ઈન્ટરનેટ ટ્રાફિક અને વોલ્યુમ સંગ્રહિત ડેટાના વોલ્યુમમાં વધારો. આ ઘણું છે, અને આવો કચરો કોઈને પોસાય તેમ નથી.

યુનિકોડના વિકાસના પરિણામે, UTF-16, જે એટલું સફળ બન્યું કે અમે જે અક્ષરોનો ઉપયોગ કરીએ છીએ તે તમામ અક્ષરો માટે મૂળભૂત જગ્યા તરીકે તેને મૂળભૂત રીતે અપનાવવામાં આવ્યું છે. તે એક અક્ષરને એન્કોડ કરવા માટે બે બાઇટ્સનો ઉપયોગ કરે છે. ચાલો જોઈએ કે આ વસ્તુ કેવી દેખાય છે.

વિન્ડોઝ ઑપરેટિંગ સિસ્ટમમાં, તમે "સ્ટાર્ટ" - "પ્રોગ્રામ્સ" - "એસેસરીઝ" - "સિસ્ટમ ટૂલ્સ" - "કેરેક્ટર ટેબલ" પાથને અનુસરી શકો છો. પરિણામે, તમારી સિસ્ટમ પર ઇન્સ્ટોલ કરેલા તમામ ફોન્ટ્સના વેક્ટર આકાર સાથે કોષ્ટક ખુલશે. જો તમે "અદ્યતન વિકલ્પો" માં યુનિકોડ અક્ષર સેટ પસંદ કરો છો, તો તમે દરેક ફોન્ટ માટે તેમાં સમાવિષ્ટ અક્ષરોની સંપૂર્ણ શ્રેણી અલગથી જોઈ શકશો.

માર્ગ દ્વારા, તેમાંના કોઈપણ પર ક્લિક કરીને, તમે તેના બે-બાઈટ જોઈ શકો છો UTF-16 ફોર્મેટમાં કોડ, જેમાં ચાર હેક્સાડેસિમલ અંકોનો સમાવેશ થાય છે:

16 બિટ્સનો ઉપયોગ કરીને UTF-16 માં કેટલા અક્ષરોને એન્કોડ કરી શકાય છે? 65,536 (સોળની બે ઘાત), અને આ તે સંખ્યા છે જેને યુનિકોડમાં બેઝ સ્પેસ તરીકે અપનાવવામાં આવી હતી. વધુમાં, તેનો ઉપયોગ કરીને લગભગ 20 લાખ અક્ષરોને એન્કોડ કરવાની રીતો છે, પરંતુ તે ટેક્સ્ટના એક મિલિયન અક્ષરોની વિસ્તૃત જગ્યા સુધી મર્યાદિત હતી.

પરંતુ યુનિકોડ એન્કોડિંગનું આ સફળ સંસ્કરણ પણ જેમણે લખ્યું છે તેમને ખૂબ સંતોષ ન મળ્યો, ઉદાહરણ તરીકે, ફક્ત અંગ્રેજી ભાષા, કારણ કે ASCII ના વિસ્તૃત સંસ્કરણથી UTF-16 માં સંક્રમણ પછી, દસ્તાવેજોનું વજન બમણું થઈ ગયું (Aski માં એક અક્ષર દીઠ એક બાઈટ અને UTF-16 માં સમાન અક્ષર દીઠ બે બાઈટ).

યુનિકોડ કન્સોર્ટિયમમાં દરેકને અને દરેક વસ્તુને સંતુષ્ટ કરવા માટે તે ચોક્કસપણે હતું જેની સાથે આવવાનું નક્કી કરવામાં આવ્યું હતું. ચલ લંબાઈ એન્કોડિંગ. તેને UTF-8 કહેવામાં આવતું હતું. નામમાં આઠ હોવા છતાં, તે વાસ્તવમાં ચલ લંબાઈ ધરાવે છે, એટલે કે. ટેક્સ્ટના દરેક અક્ષરને એકથી છ બાઇટ્સ લંબાઈના ક્રમમાં એન્કોડ કરી શકાય છે.

વ્યવહારમાં, UTF-8 માત્ર એક થી ચાર બાઈટ સુધીની રેન્જનો ઉપયોગ કરે છે, કારણ કે કોડના ચાર બાઈટથી આગળ કોઈ પણ વસ્તુની કલ્પના કરવી સૈદ્ધાંતિક રીતે શક્ય નથી. તેમાંના તમામ લેટિન અક્ષરો એક બાઈટમાં એન્કોડ કરેલા છે, જેમ કે સારા જૂના ASCII માં.

નોંધનીય બાબત એ છે કે ફક્ત લેટિન મૂળાક્ષરોને એન્કોડ કરવાના કિસ્સામાં, તે પ્રોગ્રામ્સ કે જે યુનિકોડને સમજી શકતા નથી તેઓ પણ YTF-8 માં એન્કોડ કરેલ છે તે વાંચશે. તે. અસુકાનો મુખ્ય ભાગ ફક્ત યુનિકોડ કન્સોર્ટિયમની આ રચનામાં ટ્રાન્સફર કરવામાં આવ્યો હતો.

UTF-8 માં સિરિલિક અક્ષરો બે બાઈટમાં એન્કોડ કરવામાં આવે છે, અને ઉદાહરણ તરીકે, જ્યોર્જિયન અક્ષરો ત્રણ બાઈટમાં એન્કોડ કરવામાં આવે છે. યુનિકોડ કન્સોર્ટિયમ, યુટીએફ 16 અને 8 બનાવ્યા પછી, મુખ્ય સમસ્યા હલ કરી - હવે અમારી પાસે છે ફોન્ટમાં એક કોડ સ્પેસ હોય છે. અને હવે તેમના ઉત્પાદકો તેમની શક્તિ અને ક્ષમતાઓના આધારે ફક્ત ટેક્સ્ટ અક્ષરોના વેક્ટર સ્વરૂપોથી જ ભરી શકે છે. હવે તેઓ સેટમાં પણ આવે છે.

ઉપરના "કેરેક્ટર ટેબલ" માં તમે જોઈ શકો છો કે વિવિધ ફોન્ટ્સ સપોર્ટ કરે છે વિવિધ માત્રામાંચિહ્નો કેટલાક યુનિકોડ-સમૃદ્ધ ફોન્ટ્સ ભારે હોઈ શકે છે. પરંતુ હવે તેઓ એ હકીકતમાં ભિન્ન નથી કે તેઓ વિવિધ એન્કોડિંગ્સ માટે બનાવવામાં આવ્યા હતા, પરંતુ હકીકત એ છે કે ફોન્ટ ઉત્પાદકે ચોક્કસ વેક્ટર સ્વરૂપો સાથે સિંગલ કોડ સ્પેસ ભરેલી છે અથવા સંપૂર્ણ રીતે ભરી નથી.

રશિયન અક્ષરોને બદલે ક્રેઝી શબ્દો - તેને કેવી રીતે ઠીક કરવું

ચાલો હવે જોઈએ કે ટેક્સ્ટને બદલે krakozyabrs કેવી રીતે દેખાય છે અથવા, બીજા શબ્દોમાં કહીએ તો, રશિયન ટેક્સ્ટ માટે યોગ્ય એન્કોડિંગ કેવી રીતે પસંદ કરવામાં આવે છે. વાસ્તવમાં, તે તે પ્રોગ્રામમાં સેટ છે જેમાં તમે આ જ ટેક્સ્ટ અથવા કોડને ટેક્સ્ટ ટુકડાઓનો ઉપયોગ કરીને બનાવો છો અથવા સંપાદિત કરો છો.

ટેક્સ્ટ ફાઇલોને સંપાદિત કરવા અને બનાવવા માટે, હું અંગત રીતે મારા મતે, ખૂબ જ સારો ઉપયોગ કરું છું. જો કે, તે સેંકડો અન્ય પ્રોગ્રામિંગ અને માર્કઅપ લેંગ્વેજના સિન્ટેક્સને હાઇલાઇટ કરી શકે છે, અને પ્લગઇન્સનો ઉપયોગ કરીને વિસ્તૃત કરવાની ક્ષમતા પણ ધરાવે છે. આપેલી લિંક પર આ અદ્ભુત પ્રોગ્રામની વિગતવાર સમીક્ષા વાંચો.

Notepad++ ના ટોચના મેનૂમાં એક આઇટમ “Encodings” છે, જ્યાં તમારી પાસે તમારી સાઇટ પર ડિફૉલ્ટ રૂપે ઉપયોગમાં લેવાતા વર્તમાન વિકલ્પમાં કન્વર્ટ કરવાની તક હશે:

જુમલા 1.5 અને તેનાથી ઉપરની સાઇટના કિસ્સામાં, તેમજ વર્ડપ્રેસ પરના બ્લોગના કિસ્સામાં, તમારે તિરાડોના દેખાવને ટાળવા માટે વિકલ્પ પસંદ કરવો જોઈએ. UTF 8 BOM વગર. BOM ઉપસર્ગ શું છે?

હકીકત એ છે કે જ્યારે તેઓ YUTF-16 એન્કોડિંગ વિકસાવી રહ્યા હતા, ત્યારે કેટલાક કારણોસર તેઓએ તેની સાથે સીધી ક્રમ (ઉદાહરણ તરીકે, 0A15) અને વિપરીત (150A) બંનેમાં અક્ષર કોડ લખવાની ક્ષમતા જેવી વસ્તુને જોડવાનું નક્કી કર્યું. . અને કોડ્સ વાંચવા માટે પ્રોગ્રામ્સ બરાબર સમજવા માટે, તેની શોધ કરવામાં આવી હતી BOM(બાઈટ ઓર્ડર માર્ક અથવા, બીજા શબ્દોમાં, સહી), જે દસ્તાવેજોની શરૂઆતમાં ત્રણ વધારાના બાઈટ ઉમેરવામાં વ્યક્ત કરવામાં આવી હતી.

UTF-8 એન્કોડિંગમાં, યુનિકોડ કન્સોર્ટિયમમાં કોઈ BOM પૂરા પાડવામાં આવ્યા ન હતા, અને તેથી હસ્તાક્ષર (દસ્તાવેજની શરૂઆતમાં તે કુખ્યાત વધારાના ત્રણ બાઇટ્સ) ઉમેરવાથી કેટલાક પ્રોગ્રામ્સને કોડ વાંચતા અટકાવે છે. તેથી, UTF માં ફાઇલો સાચવતી વખતે, આપણે હંમેશા BOM (હસ્તાક્ષર વિના) વિના વિકલ્પ પસંદ કરવો જોઈએ. તેથી તમે અગાઉથી છો તમારી જાતને ક્રૉકોઝિયાબર્સથી બચાવો.

નોંધનીય બાબત એ છે કે વિન્ડોઝમાં કેટલાક પ્રોગ્રામ્સ આ કરી શકતા નથી (તેઓ BOM વિના UTF-8 માં ટેક્સ્ટ સાચવી શકતા નથી), ઉદાહરણ તરીકે, તે જ કુખ્યાત વિન્ડોઝ નોટપેડ. તે દસ્તાવેજને UTF-8 માં સાચવે છે, પરંતુ તેમ છતાં તેની શરૂઆતમાં સહી (ત્રણ વધારાની બાઇટ્સ) ઉમેરે છે. તદુપરાંત, આ બાઇટ્સ હંમેશા સમાન રહેશે - સીધા ક્રમમાં કોડ વાંચો. પરંતુ સર્વર્સ પર, આ નાની વસ્તુને કારણે, સમસ્યા ઊભી થઈ શકે છે - બદમાશ બહાર આવશે.

તેથી, કોઈપણ સંજોગોમાં નિયમિત વિન્ડોઝ નોટપેડનો ઉપયોગ કરશો નહીંજો તમે કોઈ તિરાડો ન દેખાય તો તમારી સાઇટ પરના દસ્તાવેજોને સંપાદિત કરવા. શ્રેષ્ઠ અને સૌથી વધુ સરળ વિકલ્પહું પહેલેથી જ ઉલ્લેખિત નોટપેડ ++ સંપાદકને ધ્યાનમાં લઉં છું, જેમાં વ્યવહારીક રીતે કોઈ ગેરફાયદા નથી અને તેમાં ફક્ત ફાયદા છે.

Notepad++ માં, જ્યારે તમે એન્કોડિંગ પસંદ કરો છો, ત્યારે તમારી પાસે ટેક્સ્ટને UCS-2 એન્કોડિંગમાં કન્વર્ટ કરવાનો વિકલ્પ હશે, જે યુનિકોડ સ્ટાન્ડર્ડની પ્રકૃતિમાં ખૂબ જ નજીક છે. નોટપેડમાં પણ ANSI માં ટેક્સ્ટને એન્કોડ કરવાનું શક્ય બનશે, એટલે કે. રશિયન ભાષાના સંબંધમાં, આ વિન્ડોઝ 1251 હશે, જે આપણે પહેલાથી જ ઉપર વર્ણવેલ છે. આ માહિતી ક્યાંથી આવે છે?

તે તમારા રજિસ્ટરમાં નોંધાયેલ છે ઓપરેટિંગ સિસ્ટમવિન્ડોઝ - ANSI ના કિસ્સામાં કયું એન્કોડિંગ પસંદ કરવું, જે OEM ના કિસ્સામાં પસંદ કરવું (રશિયન ભાષા માટે તે CP866 હશે). જો તમે તમારા કમ્પ્યુટર પર બીજી ડિફૉલ્ટ ભાષા ઇન્સ્ટોલ કરો છો, તો આ એન્કોડિંગ્સ એ જ ભાષા માટે ANSI અથવા OEM શ્રેણીમાંથી સમાન ભાષા સાથે બદલવામાં આવશે.

તમે દસ્તાવેજને નોટપેડ++ માં તમને જોઈતા એન્કોડિંગમાં સાચવો અથવા સંપાદન માટે સાઇટ પરથી દસ્તાવેજ ખોલો તે પછી, તમે સંપાદકના નીચેના જમણા ખૂણે તેનું નામ જોઈ શકો છો:

rednecks ટાળવા માટેઉપર વર્ણવેલ ક્રિયાઓ ઉપરાંત, સાઇટના તમામ પૃષ્ઠોના સ્રોત કોડના હેડરમાં આ એન્કોડિંગ વિશેની માહિતી લખવા માટે તે ઉપયોગી થશે જેથી સર્વર અથવા સ્થાનિક હોસ્ટ પર કોઈ મૂંઝવણ ન રહે.

સામાન્ય રીતે, Html સિવાયની તમામ હાઇપરટેક્સ્ટ માર્કઅપ ભાષાઓ ખાસ xml ઘોષણાનો ઉપયોગ કરે છે, જે ટેક્સ્ટ એન્કોડિંગનો ઉલ્લેખ કરે છે.

કોડનું પદચ્છેદન કરતાં પહેલાં, બ્રાઉઝર જાણે છે કે કયું સંસ્કરણ ઉપયોગમાં લેવાય છે અને તે ભાષાના અક્ષર કોડને કેવી રીતે અર્થઘટન કરવાની જરૂર છે. પરંતુ નોંધનીય બાબત એ છે કે જો તમે દસ્તાવેજને ડિફૉલ્ટ યુનિકોડમાં સાચવો છો, તો આ xml ઘોષણા અવગણવામાં આવી શકે છે (જો BOM ન હોય તો એન્કોડિંગને UTF-8 ગણવામાં આવશે અથવા જો BOM હોય તો UTF-16 ગણવામાં આવશે).

Html ભાષા દસ્તાવેજના કિસ્સામાં, એન્કોડિંગનો ઉપયોગ સૂચવવા માટે થાય છે મેટા તત્વ, જે ઓપનિંગ અને ક્લોઝિંગ હેડ ટૅગ્સ વચ્ચે લખેલું છે:

... ...

આ એન્ટ્રી માં અપનાવવામાં આવેલ એન્ટ્રી કરતા તદ્દન અલગ છે, પરંતુ તે નવા Html 5 સ્ટાન્ડર્ડ સાથે સંપૂર્ણ રીતે સુસંગત છે જે ધીમે ધીમે રજૂ કરવામાં આવી રહ્યું છે, અને હાલમાં ઉપયોગમાં લેવાતા કોઈપણ બ્રાઉઝર દ્વારા તે સંપૂર્ણપણે યોગ્ય રીતે સમજી શકાશે.

સૈદ્ધાંતિક રીતે, એચટીએમએલ દસ્તાવેજ એન્કોડિંગ દર્શાવતું મેટા ઘટક મૂકવું વધુ સારું રહેશે દસ્તાવેજ હેડરમાં શક્ય તેટલું ઊંચુંજેથી મૂળ ANSI (જે હંમેશા યોગ્ય રીતે અને કોઈપણ ભિન્નતામાં વાંચવામાં આવે છે) ના લખાણમાં પ્રથમ અક્ષરનો સામનો કરતી વખતે, બ્રાઉઝર પાસે પહેલાથી જ આ અક્ષરોના કોડનું અર્થઘટન કેવી રીતે કરવું તેની માહિતી હોવી જોઈએ.

તમને શુભકામનાઓ! બ્લોગ સાઇટના પૃષ્ઠો પર ટૂંક સમયમાં મળીશું

તમને રસ હોઈ શકે છે

URL સરનામાં શું છે, સાઇટ માટેની સંપૂર્ણ અને સંબંધિત લિંક્સ કેવી રીતે અલગ પડે છે?
ઓપનસર્વર - એક આધુનિક સ્થાનિક સર્વર અને તેના ઉપયોગનું ઉદાહરણ વર્ડપ્રેસ સ્થાપનોકમ્પ્યુટર પર
Chmod શું છે, ફાઇલો અને ફોલ્ડર્સ (777, 755, 666) ને કઈ પરવાનગીઓ સોંપવી અને તે PHP દ્વારા કેવી રીતે કરવું
સાઇટ અને ઑનલાઇન સ્ટોર દ્વારા યાન્ડેક્ષ શોધ