
Навигация по странице
Текстовые редакторы в ЕГЭ по информатике
В ЕГЭ по информатике есть одно уникальное задание, в котором все, что от вас требуется — это умение грамотно пользоваться встроенными инструментами в текстовый редактор.
Однако, не стоит думать, что это простое задание, в котором можно с легкостью получить заветный балл. Порой именно в задании 10 ЕГЭ по информатике можно легко ошибиться, если не знать, как правильно использовать инструмент поиска в текстовом редакторе. В качестве текстового редактора в ЕГЭ по информатике обычно используется Microsoft Word или его аналоги. Мы же, в рамках этой статьи, разберем именно работу с поиском в Word.
В Microsoft Word инструмент поиска — это не просто функция для нахождения слов. С его помощью можно гибко работать с текстом, в том числе используя регулярные выражения: находить сложные комбинации символов, подсчитывать повторы и решать другие нетривиальные задачи в особо сложных вариантах ЕГЭ.
Поиск в Word
Обычно в задании 10 ЕГЭ по информатике дан текстовый файл, в котором необходимо найти сколько раз встречается заданное слово во всем тексте или в определённой его части.
Для решения этого задания сначала откроем скачанный файл в текстовом редакторе Microsoft Word. Далее нам необходимо воспользоваться функцией поиска, которую можно вызвать по нажатию на пункт «Найти» во вкладке «Главная». Также можно вызвать этот инструмент нажатием сочетания клавиш Ctrl+F
.
В результате у нас откроется слева окно навигации со строкой поиска в документе.

По умолчанию поиск не чувствителен к регистру и ищет введённую строку как часть других слов.
Например, если ввести слово «Поиск», то Word найдет слово «поиск» как часть другого слова — поиском

На практике, обычного поиска не хватает для успешного решения задания 10 и требуется использовать дополнительные параметры поиска.
Для того, чтобы открыть настройки параметров поиска, необходимо нажать стрелку вниз в строке поиска и в открывшемся меню выбрать «Параметры…».

Далее мы разберем каждый параметр подробней.
Учитывать регистр
Этот параметр позволяет учитывать регистр букв в поиске, то есть различать заглавные и строчные буквы.
Например, при выключенном параметре «Учитывать регистр», если ввести в поле поиска строку «шаг», то получим 2 результата с текстом «Шаг в будущее шаг в будущее».

Теперь в параметрах поиска включим данный параметр и посмотрим, как изменится наш результат.

Как мы видим, при учёте регистра у нас осталось лишь одно совпадение введённой строки со словом «шаг», которое начинается со строчной буквы.

Только слово целиком
Данный параметр позволяет находить только отдельно стоящие строки, соответствующие введённой. Таким образом поиск игнорирует вхождения искомой строки, которые являются частью других слов.
Например без включенного параметра «Только слово целиком» строка «код» будет найдена 4 раза в следующем тексте: «Кодировка кодом кодирует код».

При включении этого параметра остаётся только один результат поиска — отдельно стоящее слово «код».

Не учитывать знаки препинания
При включении данного параметра поиска Word будет игнорировать любые знаки препинания внутри искомых строк.
Например, поиск «Шаг в будущее» вернёт результатом как строку «Шаг в будущее», так и «Шаг, в. будущее»

Не учитывать пробелы
При включенном параметре поиска «Не учитывать пробелы» Word будет игнорировать обычные пробелы при поиске.
Использование этого параметра удобно для поиска словосочетаний, которые могут быть написаны с разным количеством пробелов или с пропуском пробела между словами.
Так, при поиске «Шагвбудущее» с этим параметром будут найдены следующие строки:
«Шаг в будущее», «Шагв будущее», «Шаг вбудущее», «Шагвбудущее».

Регулярные выражения в Word
Последним из не рассмотренных параметров поиска, которые доступны для русского языка, является параметр «Подстановочные знаки».
Он позволяет использовать при поиске язык регулярных выражений, что значительно упрощает задачу поиска при знании синтаксиса, разумеется.
Регулярные выражения — это шаблоны, которые используются для поиска определённого сочетания символов (строки) в тексте. Такие шаблоны состоят из различных специальных символов и операторов, каждый из которых выполняет свою чётко заданную роль во всем выражении.
В Microsoft Word регулярные выражения применяются для выполнения более гибких и детализированных поисков по тексту. Это особенно полезно, когда нужно найти строку, которая соответствует определённому шаблону, а не конкретным словам или фразам русского языка.
Регулярные выражения используют символы, такие как «?», «*», «@», «{…}» и «[…]», для указания условий поиска, что позволяет задавать шаблоны для текстов разных форматов, длины искомой строки и её лексического состава.
Например, регулярное выражение может найти любые числа, даты, телефонные номера, слова с определённым окончанием, текст с чётко заданным количеством букв и даже конкретные сочетания символов в документе.
Далее рассмотрим синтаксис регулярных выражений, которые применяются для поиска по документу в Word.
Знак вопроса (?)
Обозначает любой одиночный символ в позиции, где поставлен вопросительный знак. Полезен, если нужно найти слова, различающиеся только одним символом.
Так, например, шаблону «д?м» будут соответствовать следующие слова (выделенны красным) из строки: «дом дым дам дном»

Знак *
Обозначает любое количество символов, включая отсутствие символов. Это один из самых универсальных подстановочных знаков для поиска всех возможных вариантов слова или фразы с любым количеством символов.
Например, с помощью шаблона «*со» можем найти в тексте все слова, оканчивающиеся на «-со».

Квадратные скобки
Используются для обозначения диапазона символов, любой из которых может находиться на данной позиции. Полезно, если нужно искать слова с похожими буквами в определённой позиции.
Если символы просто перечислены друг за другом, например [ао], то это означает, что будут найдены строки, в которых на этой позиции либо символ «а», либо «о».
Так, например, шаблону «н[ао]с» будут соответствовать следующие слова (выделены красным) из строки: «У нас есть нос»

Также символы можно перечислять через знак «–». Например, перечислить все заглавные буквы латинского алфавита можно так: [A-Z].
Для русского алфавита запись выглядит аналогичным образом, только здесь отдельно выносится буква Ё: [А-ЯЁ].
Например, шаблон «[А-ЯЁ]Ж» позволит найти все слова в строке: «Ёж Уж Иж».

Для исключения символов из диапазона используется знак «!
». Если поставить «!
» в квадратные скобки, Word будет искать только те символы, которые не соответствуют указанному в скобках набору.
Например из прошлого примера найдем все слова из двух букв, оканчивающиеся на «ж», но которые не начинаются на «У»
Шаблон: [!У]ж
Строка: Ёж Уж Иж

Фигурные скобки
В синтаксисе регулярных выражений с помощью фигурных скобок указывается диапазон повторений предыдущего символа.
В зависимости от количества аргументов внутри фигурных скобок различают 3 возможных варианта:
{n}
— строгоn
повторений предыдущего символа или выражения{n;}
— количество повторений предыдущего символа или выражения больше или равноn
{n;m}
— отn
доm
повторений предыдущего символа или выражения
Так, например, шаблону «истин{2}ый» будет соответствовать только одно слово из следующей строки: «Правильно: истинный, неправильно: истиный или истиннный»

Если же после цифры 2 в фигурных скобках поставить точку с запятой, то Word будет искать слова с двумя и более буквами «н».
Шаблон: истин{2;}ый
Строка: Правильно: истинный, неправильно: истиный или истиннный

Теперь найдем только те слова, в которых от 1 до 2 букв «н».
Шаблон: истин{1;2}ый
Строка: Правильно: истинный, неправильно: истиный или истиннный

Символ @
Работа данного символа будет аналогична записи {1;}
. То есть символ @
позволяет найти одно и более повторений предыдущего символа.
Шаблон: деревян@ый
Строка: Как правильно: деревяный или деревянный?

Символы < и >
Данные символы служат для обозначения начала и конца слова. Они помогают найти только целые слова или их формы, игнорируя остальные части слов, которые случайно могут подходить под шаблон поиска.
Символ «<
» указывает, что искомая фраза должна находиться в начале слова. Он позволяет находить слова, которые начинаются с указанного набора символов, при этом в результаты не будет включена остальная часть слова, следующая за шаблоном.
Найдем фрагмент «код» только у тех слов, которые начинаются на «код-».
Шаблон: <код
Строка: код, кодировать, закодировать, кодификатор

Символ «>
» указывает, что искомая фраза должна находиться в конце слова. Он позволяет найти слова, которые заканчиваются на указанный набор символов, исключая фрагменты в середине или начале слов.
Найдем фрагмент «байт» только у тех слов, которые оканчиваются на «-байт».
Шаблон: байт>
Строка: Килобайт Байтовое Мегабайт Байт

Найти все слово целиком можно указав в начале и конце искомой строки знаки «<
» и «>
».
Например, найдем слова, которые начинаются на «авто-» и далее содержат любое количество символов.
Шаблон: <авто*>
Строка: автобус полуавтомат автомобиль авторизация
