Программирование • 15 октября • 303

Транслит для заголовков Yoast Table Of Content

Содержание

Проблема якорных ссылок на кириллице
Транслит якорных ссылок для Yoast Table of Contents
Разбор кода

Обычно для улучшения SEO показателей используется "содержание" статьи. Этот блок генерируется из заголовков (H1, H2, H3 и т.д.) статьи. Для этого используются разные WordPress плагины такие как Table of Contents Plus или Easy Table of Contents.

Лично я использую Yoast Table of Contents в редакторе Gutenberg

Выглядет это следующим образом:

Преимущество данного способа заключается в том, что можно добавлять содержимое в любом месте на странице, например после изображения статьи или в конце статьи.

Проблема якорных ссылок на кириллице

По умолчанию Yoast генерирует id якорных ссылок из названия заголовка, поэтому ссылка и якорь будут на кириллице. Это не всегда хорошо! Например если вы захотите подключить турбо страницы от Яндекс, то валидатор будет ругаться на такие якорные ссылки следующим сообщением:

Якорь, на который указывает ссылка, отсутствует или указан у неподдерживаемого элемента. 
В качестве якоря можно использовать контент в виде аккордеона или заголовок h1–h6

Транслит якорных ссылок для Yoast Table of Contents

Чтобы исправить эту проблему достаточно добавить в functions.php этот код:

add_filter('the_content', 'toc_translit_link');
function toc_translit_link($content) {
	$translit = [
		'А' => 'A', 'Б' => 'B', 'В' => 'V', 'Г' => 'G', 'Ѓ' => 'G',
		'Ґ' => 'G', 'Д' => 'D', 'Е' => 'E', 'Ё' => 'YO', 'Є' => 'YE',
		'Ж' => 'ZH', 'З' => 'Z', 'Ѕ' => 'Z', 'И' => 'I', 'Й' => 'J',
		'Ј' => 'J', 'І' => 'I', 'Ї' => 'YI', 'К' => 'K', 'Ќ' => 'K',
		'Л' => 'L', 'Љ' => 'L', 'М' => 'M', 'Н' => 'N', 'Њ' => 'N',
		'О' => 'O', 'П' => 'P', 'Р' => 'R', 'С' => 'S', 'Т' => 'T',
		'У' => 'U', 'Ў' => 'U', 'Ф' => 'F', 'Х' => 'H', 'Ц' => 'TS',
		'Ч' => 'CH', 'Џ' => 'DH', 'Ш' => 'SH', 'Щ' => 'SHH', 'Ъ' => '',
		'Ы' => 'Y', 'Ь' => '', 'Э' => 'E', 'Ю' => 'YU', 'Я' => 'YA',
		'а' => 'a', 'б' => 'b', 'в' => 'v', 'г' => 'g', 'ѓ' => 'g',
		'ґ' => 'g', 'д' => 'd', 'е' => 'e', 'ё' => 'yo', 'є' => 'ye',
		'ж' => 'zh', 'з' => 'z', 'ѕ' => 'z', 'и' => 'i', 'й' => 'j',
		'ј' => 'j', 'і' => 'i', 'ї' => 'yi', 'к' => 'k', 'ќ' => 'k',
		'л' => 'l', 'љ' => 'l', 'м' => 'm', 'н' => 'n', 'њ' => 'n',
		'о' => 'o', 'п' => 'p', 'р' => 'r', 'с' => 's', 'т' => 't',
		'у' => 'u', 'ў' => 'u', 'ф' => 'f', 'х' => 'h', 'ц' => 'ts',
		'ч' => 'ch', 'џ' => 'dh', 'ш' => 'sh', 'щ' => 'shh', 'ъ' => '',
		'ы' => 'y', 'ь' => '', 'э' => 'e', 'ю' => 'yu', 'я' => 'ya'
	];

	$content = preg_replace_callback("/<(a|h)(.*?)(href|id)=('|\")(h|#h)(-.*?)('|\")(.*?)>/i", function ($match) use ($translit) {
		return "<" . $match[1] . $match[2] . "$match[3]" . "=" . $match[4]   . $match[5] . strtr($match[6], $translit) . $match[7] . $match[8] . ">";
	}, $content);

	return $content;
}

Разбор кода

Из кода выше видно, что для преобразования кириллицы в латиницу нужно использовать фильтр the_content. Функция the_content() выводит содержимое текущего поста (записи, страницы или произвольного типа поста) в цикле. То-есть мы берем весь контент поста и с помощью Regex ищем нужные совпадения.

https://regex101.com/r/eklqpk/1

Массив $translit нужен для замены символов. Используя функцию strtr() сделаем замены, тем самым и сгенерируем нужные нам ссылки на транслите.

Но перед заменой символов нужно найти строки (якоря и айдишники)

Для поиска и замены функция preg_replace нам не подходит, так как мы должны поменять в определенной группе совпадений русские буквы на латинские с помощью функции strtr.

По этому мы используем preg_replace_callback, которая позволяет манипулировать с совпадением.

Из скриншота выше видно, что нам нужно сделать замену в двух местах, в самой ссылке и якоре. После замены нужных данных мы возвращаем сгенерированный контент:

return $content;

Написать комментарий