БлогNot. Word: специальные символы и подстановочные знаки
Word: специальные символы и подстановочные знаки
В окне «Найти и заменить» Microsoft Word есть два типа подстановок — специальные символы и подстановочные знаки. Те и другие можно вводить в строки поиска и замены, включив используя список «Special» («Специальный») в полностью открытом окне «Найти и заменить» (нажать комбинацию клавиш Ctrl+H , потом кнопку » Больше>> «).
Специальные символы — это те, которых нет на клавиатуре или которые нельзя непосредственно вписать в строки поиска/замены, например, разрыв строки.
Если в окне поиска/замены включен чекбокс Use wildcards (Подстановочные знаки), то можно задавать достаточно сложные условия поиска и замены, потому что подстановчные знаки — это офисная реализация всё тех же регулярных выражений.
Чекбокс «Подстановочные знаки» в работе — убираем лишние пробелы в тексте
Некоторые символы и знаки можно использовать только в строке поиска, а некоторые — только в строке замены. При этом возможность применения части символов зависит от того, включен ли чекбокс Use wildcards (Подстановочные знаки).
Полный список подстановок в самом Word отсутствует или я его не нашёл, поэтому ниже приводится более-менее адекватный список, актуальный для всех версий Word плюс немного примеров.
1. Строка поиска
Специальные символы, которые можно использовать только если опция Use wildcards (Подстановочные знаки) выключена
Спец. символы
Обозначение (англ.)
Обозначение (рус.)
^p
Paragraph mark (¶)
Конец абзаца (¶)
^?
Any character
Любой символ
^#
Any digit
Любая цифра
^$
Any letter
Любая буква
^e
Endnote mark
Концевая сноска
^d
Field
Поле
^f
Footnote mark
Нижняя сноска
^b
Section break (===End of section===)
Разрыв секции
^w
Whitespace
Любое количество и комбинация обыкновенных и неразрываемых пробелов, табуляций и концов абзаца
Специальные символы, использование которых не зависит от опции Use wildcards (Подстановочные знаки)
Спец. символы
Обозначение (англ.)
Обозначение (рус.)
^t
Tab character
Символ табуляции
^a
Comment mark
Комментарий
^0nnn
ANSI or ASCII characters
Любой ANSI или ASCII символ с кодом nnn
^^
Caret character
Символ ^
^g
Graphic
Графика
^n
Column break (···Column Break···)
Разрыв колонки
^l
Manual line break
Принудительный разрыв строки
^m
Manual page break (—Page Break—)
Принудительный разрыв страницы (—Page Break—). Если опция Use wildcards включена, то ищет принудительный разрыв и страницы, и секции
^+
Em dash ()
Длинное тире (). Символ с кодом 0151
^=
En dash ()
Короткое тире (). Символ с кодом 0150
^s
Nonbreaking space (°)
Неразрывный пробел (°)
^
2. Строка замены
Специальные символы, использование которых не зависит от опции Use wildcards (Подстановочные знаки)
Спец. символы
Обозначение (англ.)
Обозначение (рус.)
^p
Paragraph mark (¶)
Разрыв абзаца (¶)
^t
Tab character
Символ табуляции
^0nnn
ANSI or ASCII characters
Любой ANSI или ASCII символ с кодом nnn
^^
Caret character
Символ ^
^c
Clipboard contents
Содержимое буфера обмена
^&
Contents of the Find what box
Содержимое строки поиска (или то, что найдено)
^n
Column break (···Column Break···)
Разрыв колонки
^l
Manual line break ( ¿ )
Принудительный разрыв строки
^m
Manual page break (—Page Break—)
Принудительный разрыв страницы
^+
Em dash (-)
Длинное тире (-). Символ с кодом 0151
^=
En dash ()
Короткое тире (). Символ с кодом 0150
^s
Nonbreaking space (°)
Неразрывный пробел (°)
^
Примечание 1. В операторах и точка с запятой означает List separator (Разделитель элементов списка) из настроек операционной системы, завиящих от локали (например, в США — запятая, в России — точка с запятой).
Примечание 2. Для поиска в документе символов, которые в строке поиска «заняты» как специальные перед ними ставится обратный слэш ( \ ). Например, если включена опция Use wildcards (Подстановочные знаки), для поиска восклицательного знака в строке поиска вводится \!
3. Примеры для поиска
Строка поиска
Что ищет
[!^0013]^0013[!^0013]
Конец абзаца в окружении двух других символов
^0032
Два и более пробелов
[. ;\!\?]
Знак препинания
Вещественное число, набранное через запятую
Русское слово (зависит от кодировки)
4. Примеры для замены
Подстановочные знаки включены!
Строка поиска
Строка замены
Что заменяет
(^0013)
\1
Удаление пустых строк (если они создавались нажатием Enter)
^0032([. ;\!\?])
\1
Удаление пробелов перед знаками препинания
([0-9])^0032([0-9])
\1^s\2
Замена пробелов между цифрами на неразрывные пробелы
-([0-9])
^0150\1
Замена дефисов перед цифрами на правильный символ «минус»
Ивано([а-я]@>)
Петро\1
Замена Ивановых на Петровых во всех падежах сразу (конечно, фамилии должны склоняться одинаково)
( )
\1,\2
Замена десятичных точек между цифрами на запятые
24.09.2020, 10:16; рейтинг: 6308
Источник
Символы Unicode для сайта и SEO
Известно, что некоторые специальные символы могут быть отображены в Title и сниппете на выдаче. Это может привлечь внимание пользователей, в ряде тематик. В коммерческих сферах продвижения — использование символов должно быть осторожное, вдумчивое. Также, символы Unicode оказываются полезны для оформления текстов, дизайна и нужд SEO. Вы можете самостоятельно протестировать спец. символы и понять, какие из них могут отображаться в Title на выдаче. Ответ будет различен для различных поисковых систем.
Самые популярные: символы валют, рубль, Инь и Ян, серп и молот
Спец. символы используемые для математики и физики в Unicode
Наборы нестандартных стрелочек, указателей
Шахматные фигуры, масти, ноты
Юникод знаки с руками и смайлики (цветные)
Надеемся, что данные коды (кодировки) символов Юникода помогут вам при оформлении сайта.
Источник
Таблица кодов символов в Windows
Таблица кодов символов в современных компьютерах может быть использована любым юзером. Что это такое? И где найти подобный элемент? Как им пользоваться и для каких целей? Далее постараемся дать ответы на все перечисленные вопросы. Обычно таблицы символов позволяют печатать уникальные знаки в текстовых документов. Главное — знать, какими они бывают, а также где искать соответствующую информацию. Все намного проще, чем кажется.
Определение
Что такое таблица кодов символов? Это, как нетрудно догадаться, база данных. В ней пользователи могут увидеть сочетание числовых значений, при обработке которых в указанное место текста вставляется символ. Например, знак ♥ или ♫. На клавиатуре таких символов нет и быть не может.
Таблица символов помогает пользователям вставлять уникальные знаки в текстовые документы. Здесь можно увидеть кодировку элемента и способ его интерпретации.
Какими бывают
Кодировки символов — тип сочетания букв, цифр и знаков, которые после обработки операционной системой преобразовываются в знак. Они бывают разными.
Сегодня можно столкнуться с такими кодировками:
ASCII — способ печати специальных знаков, уникальные коды которых представлены цифрами. Это самый распространенный тип кодировки. Он был разработан в 1963 году в США. Кодировка является семибитной.
Windows-1251 — стандартная кодировка для русскоязычной «Виндовс». Она не слишком обширна и почти не пользуется спросом у юзеров.
Unicode — 16-битная кодировка для современных операционных систем. Она служит для представления символов и букв на любом языке. Используется современными пользователями наравне с ASCII.
Теперь понятно, какими бывают кодировки. Заострим внимание на первом и последнем варианте. Они пользуются самым большим спросом у современных пользователей ПК.
Где искать в Windows
Таблицы кодов символов по умолчанию вмонтированы в операционную систему «Виндовс». С их помощью юзер сможет печатать буквы и специальные знаки в любом текстовом редакторе или документе.
Для того, чтобы найти таблицу символов в «Виндовс», нужно:
Открыть пункт меню «Пуск».
Развернуть раздел «Все программы».
Выбрать папку «Стандартные»
Кликнуть по надписи «Служебные».
Заглянуть в приложение «Таблица символов».
Дело сделано. Теперь можно изучить все возможные знаки, которые только могут восприниматься операционной системой. Если дважды кликнуть по миниатюре того или иного символа, а затем щелкнуть по кнопке «Скопировать», соответствующий знак будет перенесен в буфер обмена. Из него можно выгрузить данные в текстовый документ.
Важно: в нижней части окна справа можно увидеть сочетание клавиш для быстрой печати выбранного элемента, а слева — «Юникод» для набора в тексте.
В MS Word
Таблицу кодов символов можно найти даже в текстовых редакторах. Рассмотрим алгоритм действий в MS Word. Это наиболее популярная и распространенная утилита для работы с документами в «Виндовс».
Открытие таблицы кодов символов осуществляется так:
Зайти в Word на компьютере. Можно открыть как пустой документ, так и с текстом.
Нажать в верхней части она по пункту «Вставка». Желательно развернуть весь список опций.
Навести курсор и щелкнуть ЛКМ по надписи «Специальный знак. «.
Вот и все. По центру экрана появится таблица символов. Здесь можно посмотреть таблицу ASCII, «Юникода» и не только. Для этого в нижней части окна в выпадающем списке нужно выбрать после надписи «из. » подходящую кодировку.
Вставка знака может осуществляться через двойной клик по элементу в таблице или путем активации кнопки «Вставить».
Способы обработки кода
Как мы уже говорили, таблица кодов символов помогает изучить цифро-алфавитный код того или иного символа. Как можно провести преобразование оных?
Как правило, «Юникод» обрабатывается следующим образом:
Пользователь пишет уникальный код подходящего символа. Обычно он начинается с U+.
Юзер нажимает сочетание клавиш Alt + X в текстовом редакторе.
Операционная система считывает код, после чего на месте записи появляется специальный знак.
Коды обрабатываются по одному. Это крайне важно. ASCII обрабатываются аналогичным образом.
Некоторые символы можно напечатать при помощи кнопки Alt. Обычно ее нужно зажать, а затем на цифирной панели клавиатуры набрать подходящий код. В этом случае придется заранее активировать режим Num Lock.
Источник
Unicode Character Table
Popular character sets
Symbols for Nickname
Symbols for Steam
Symbols for Facebook
1
2
3
4
5
6
7
8
9
A
B
C
D
E
F
0000−007F Basic Latin
0080−00FF Latin-1 Supplement
0100−017F Latin Extended-A
0180−024F Latin Extended-B
0250−02AF IPA Extensions
02B0−02FF Spacing Modifier Letters
0300−036F Combining Diacritical Marks
0370−03FF Greek and Coptic
0400−04FF Cyrillic
0500−052F Cyrillic Supplement
0530−058F Armenian
0590−05FF Hebrew
0600−06FF Arabic
0700−074F Syriac
0750−077F Arabic Supplement
0780−07BF Thaana
07C0−07FF NKo
0800−083F Samaritan
0840−085F Mandaic
0860−086F Syriac Supplement
08A0−08FF Arabic Extended-A
0900−097F Devanagari
0980−09FF Bengali
0A00−0A7F Gurmukhi
0A80−0AFF Gujarati
0B00−0B7F Oriya
0B80−0BFF Tamil
0C00−0C7F Telugu
0C80−0CFF Kannada
0D00−0D7F Malayalam
0D80−0DFF Sinhala
0E00−0E7F Thai
0E80−0EFF Lao
0F00−0FFF Tibetan
1000−109F Myanmar
10A0−10FF Georgian
1100−11FF Hangul Jamo
1200−137F Ethiopic
1380−139F Ethiopic Supplement
13A0−13FF Cherokee
1400−167F Unified Canadian Aboriginal Syllabics
1680−169F Ogham
16A0−16FF Runic
1700−171F Tagalog
1720−173F Hanunoo
1740−175F Buhid
1760−177F Tagbanwa
1780−17FF Khmer
1800−18AF Mongolian
18B0−18FF Unified Canadian Aboriginal Syllabics Extended
Unicode is a computing standard for the consistent encoding symbols. It was created in 1991. It’s just a table, which shows glyphs position to encoding system. Encoding takes symbol from table, and tells font what should be painted. But computer can understand binary code only. So, encoding is used number 1 or 0 to represent characters. Like In Morse code dots and dashes represents letters and digits. Each unit (1 or 0) is calling bit. 16 bits is two byte. Most known and often used coding is UTF-8. It needs 1 or 4 bytes to represent each symbol. Older coding types takes only 1 byte, so they can’t contains enough glyphs to supply more than one language.
Unicode symbols
Each Unicode character has its own number and HTML-code. Example: Cyrillic capital letter Э has number U+042D (042D – it is hexadecimal number), code ъ. In a table, letter Э located at intersection line no. 0420 and column D. If you want to know number of some Unicode symbol, you may found it in a table. Or paste it to the search string. Or search by description («Cyrillic letter E»). On the symbol page you can see how it’s looking like in different fonts and operating systems. You may copy this and paste it to Word or Facebook. Also, there are several character sets on this site for more comfortable coping.
Different part of the Unicode table includes a lot characters of different languages. Almost all writing systems using these days represent. Latin, Arabic, Cyrillic, hieroglyphs, pictographic. Letters, digits, punctuation. Also Unicode standard covers a lot of dead scripts (abugidas, syllabaries) with the historical purpose. Many other symbols, which are not belong specific writing system coded too. It’s arrows, stars, control characters etc. All humanity needs to produce high-quality text.
Unicode standard doesn’t freeze, it continues to evolve. In June 2015 was released version 8.0. More than 120 thousands characters coded for now. The Consortium does not create new symbols, just add often used. Faces (emoji) included because it was often used by Japanese mobile operators. But some units does not containing a matter of principle. There are not trademarks in Unicode table, even Windows flag or registered trademark of apple.