Как да използвам етикети на Meta Charset за кодиране на символи в HTML5

Преди въвеждането на HTML5, задаване на кодиране на символи в документ с елемент изисква от вас да напишете малко подробна линия, видяна по-долу. Това са елементите на Meta Charset, ако сте използвали HTML4 във вашата уеб страница:


Това, което е важно да забележите в този код, са кавичките, които виждате около съдържание атрибут: съдържание ="текст / html; charset = iso-8859-1". Както всички HTML атрибути, тези кавички дефинират стойността на атрибута, указвайки, че целият низ текст / html; charset = iso-8959-1 е съдържание на този елемент. Това е правилен HTML и по този начин е трябвало да бъде написан този низ. Освен това е тромав дълъг и грозен! Това също не е нещо, което вероятно бихте запомнили от върха на главата си!

В повечето случаи уеб разработчиците ще трябва да копират и поставят този код от един сайт във всеки нов, който разработват, защото писането на това от нулата изисква много.

HTML5 изрязва допълнителните „неща“

HTML5 не само добави някои нови елементи към езика, но също така значително опрости голяма част от синтаксиса на HTML, включително елемента Meta Charset. С HTML5 можете да добавите кодиране на символи с много по-лесно запомнящия се синтаксис за 

instagram viewer
МЕТА елемент, който виждате по-долу:


Сравнете този опростен синтаксис с написаното в началото на тази статия, стария синтаксис, използван за HTML4, и ще видите колко по-лесно е да пишете и запомняте версията на HTML5. Вместо да се налага да копирате и поставяте това от съществуващ сайт в който и да е нов, върху който сте работили, това е абсолютно нещо, което като преден уеб разработчик бихте могли да запомните. Това спестяване на време може да не е много, но когато вземете предвид другите области на синтаксиса, които HTML5 опростиха, спестяванията се събират!

Винаги включва кодиране на знаци

Винаги трябва да включвате кодиране на знаци за вашите уеб страници, дори ако въобще не възнамерявате да използвате такива специални символи. Ако не включите кодиране на знаци, вашият сайт става уязвим за атака на скриптове между сайтове, използвайки UTF-7.

В този сценарий нападателят вижда, че вашият сайт няма дефинирано кодиране на символи, така че подвежда браузъра да мисли, че кодирането на знаци на страницата е UTF-7. След това атакуващият инжектира кодирани UTF-7 скриптове в уеб страницата и вашият сайт е хакнат. Това е проблематично за всички участващи, от вашата компания до вашите посетители. Добрата новина е, че е лесен за избягване проблем - добавете кодиране на символи към всичките си уеб страници.

Къде да добавите кодиране на символи

Кодирането на символи за уеб страница трябва да бъде първият ред на вашите HTML

елемент. Това гарантира, че браузърът знае какво е кодирането на символи, преди да направи нещо друго на страницата, освен да определи типа на документа и да идентифицира, че това е HTML страница. Вашият HTML трябва да гласи:




...

Използване на HTTP заглавки за допълнителна сигурност

Можете също да посочите кодирането на символи в HTTP заглавките. Това е дори по-сигурно от добавянето му към HTML страницата, но ще трябва да имате достъп до конфигурациите на сървъра или .htaccess файлове, което означава, че може да се наложи да работите с хостинг доставчика на уебсайта си, за да получите такъв вид достъп или да ги накарате да направят промените Вие. Достъпът е предизвикателството тук. Самата промяна е проста, така че всеки доставчик на хостинг услуги трябва да може да направи тази промяна вместо вас с относителна лекота.

Ако използвате Apache, можете да зададете набор от символи по подразбиране за целия си сайт, като добавите: AddDefaultCharset UTF-8 до вашия корен .htaccess файл. Стандартният набор от символи на Apache е ISO-8859-1.