Поиск в Word

Текстовые редакторы в ЕГЭ по информатике

В ЕГЭ по информатике есть одно уникальное задание, в котором все, что от вас требуется — это умение грамотно пользоваться встроенными инструментами в текстовый редактор.

Однако, не стоит думать, что это простое задание, в котором можно с легкостью получить заветный балл. Порой именно в задании 10 ЕГЭ по информатике можно легко ошибиться, если не знать, как правильно использовать инструмент поиска в текстовом редакторе. В качестве текстового редактора в ЕГЭ по информатике обычно используется Microsoft Word или его аналоги. Мы же, в рамках этой статьи, разберем именно работу с поиском в Word.

В Microsoft Word инструмент поиска — это не просто функция для нахождения слов. С его помощью можно гибко работать с текстом, в том числе используя регулярные выражения: находить сложные комбинации символов, подсчитывать повторы и решать другие нетривиальные задачи в особо сложных вариантах ЕГЭ.

Поиск в Word

Обычно в задании 10 ЕГЭ по информатике дан текстовый файл, в котором необходимо найти сколько раз встречается заданное слово во всем тексте или в определённой его части.

Для решения этого задания сначала откроем скачанный файл в текстовом редакторе Microsoft Word. Далее нам необходимо воспользоваться функцией поиска, которую можно вызвать по нажатию на пункт «Найти» во вкладке «Главная». Также можно вызвать этот инструмент нажатием сочетания клавиш Ctrl+F.

В результате у нас откроется слева окно навигации со строкой поиска в документе.

Задание 10 1

По умолчанию поиск не чувствителен к регистру и ищет введённую строку как часть других слов.

Например, если ввести слово «Поиск», то Word найдет слово «поиск» как часть другого слова — поиском

Задание 10 2

Примечание

Далее в этой статье найденная часть слова (подстроки), целое слово или сочетание символов будут выделяться красным цветом. А также вместо термина «слово» будем использовать «строка».

На практике, обычного поиска не хватает для успешного решения задания 10 и требуется использовать дополнительные параметры поиска.

Для того, чтобы открыть настройки параметров поиска, необходимо нажать стрелку вниз в строке поиска и в открывшемся меню выбрать «Параметры…».

Задание 10 3

Далее мы разберем каждый параметр подробней.

Учитывать регистр

Этот параметр позволяет учитывать регистр букв в поиске, то есть различать заглавные и строчные буквы.

Примечание

  • Заглавные буквы, прописные или большие буквы — это те, которые написаны в верхнем регистре: А, Б, В, Г и так далее.
  • Строчные или маленькие буквы — это те, которые написаны в нижнем регистре: а, б, в, г и так далее.

Например, при выключенном параметре «Учитывать регистр», если ввести в поле поиска строку «шаг», то получим 2 результата с текстом «Шаг в будущее шаг в будущее».

Задание 10 4

Теперь в параметрах поиска включим данный параметр и посмотрим, как изменится наш результат.

Задание 10 5

Как мы видим, при учёте регистра у нас осталось лишь одно совпадение введённой строки со словом «шаг», которое начинается со строчной буквы.

Задание 10 6

Только слово целиком

Данный параметр позволяет находить только отдельно стоящие строки, соответствующие введённой. Таким образом поиск игнорирует вхождения искомой строки, которые являются частью других слов.

Например без включенного параметра «Только слово целиком» строка «код» будет найдена 4 раза в следующем тексте: «Кодировка кодом кодирует код».

Задание 10 7

При включении этого параметра остаётся только один результат поиска — отдельно стоящее слово «код».

Задание 10 8

Не учитывать знаки препинания

При включении данного параметра поиска Word будет игнорировать любые знаки препинания внутри искомых строк.

Например, поиск «Шаг в будущее» вернёт результатом как строку «Шаг в будущее», так и «Шаг, в. будущее»

Задание 10 9

Не учитывать пробелы

При включенном параметре поиска «Не учитывать пробелы» Word будет игнорировать обычные пробелы при поиске.

Использование этого параметра удобно для поиска словосочетаний, которые могут быть написаны с разным количеством пробелов или с пропуском пробела между словами.

Так, при поиске «Шагвбудущее» с этим параметром будут найдены следующие строки:

«Шаг в будущее», «Шагв будущее», «Шаг вбудущее», «Шагвбудущее».

Задание 10 10

Регулярные выражения в Word

Последним из не рассмотренных параметров поиска, которые доступны для русского языка, является параметр «Подстановочные знаки».

Он позволяет использовать при поиске язык регулярных выражений, что значительно упрощает задачу поиска при знании синтаксиса, разумеется.

Регулярные выражения — это шаблоны, которые используются для поиска определённого сочетания символов (строки) в тексте. Такие шаблоны состоят из различных  специальных символов и операторов, каждый из которых выполняет свою чётко заданную роль во всем выражении.

В Microsoft Word регулярные выражения применяются для выполнения более гибких и детализированных поисков по тексту. Это особенно полезно, когда нужно найти строку, которая соответствует определённому шаблону, а не конкретным словам или фразам русского языка.

Регулярные выражения используют символы, такие как «?», «*», «@», «{…}» и «[…]», для указания условий поиска, что позволяет задавать шаблоны для текстов разных форматов, длины искомой строки и её лексического состава.

Например, регулярное выражение может найти любые числа, даты, телефонные номера, слова с определённым окончанием, текст с чётко заданным количеством букв и даже конкретные сочетания символов в документе.

Далее рассмотрим синтаксис регулярных выражений, которые применяются для поиска по документу в Word.

Знак вопроса (?)

Обозначает любой одиночный символ в позиции, где поставлен вопросительный знак. Полезен, если нужно найти слова, различающиеся только одним символом.

Так, например, шаблону «д?м» будут соответствовать следующие слова (выделенны красным) из строки: «дом дым дам дном»

Задание 10 11

Знак *

Обозначает любое количество символов, включая отсутствие символов. Это один из самых универсальных подстановочных знаков для поиска всех возможных вариантов слова или фразы с любым количеством символов.

Например, с помощью шаблона «*со» можем найти в тексте все слова, оканчивающиеся на «-со».

Задание 10 12

Квадратные скобки

Используются для обозначения диапазона символов, любой из которых может находиться на данной позиции. Полезно, если нужно искать слова с похожими буквами в определённой позиции.

Если символы просто перечислены друг за другом, например [ао], то это означает, что будут найдены строки, в которых на этой позиции либо символ «а», либо «о».

Так, например, шаблону «н[ао]с» будут соответствовать следующие слова (выделены красным) из строки: «У нас есть нос»

Задание 10 13

Также символы можно перечислять через знак «». Например, перечислить все заглавные буквы латинского алфавита можно так: [A-Z].

Для русского алфавита запись выглядит аналогичным образом, только здесь отдельно выносится буква Ё: [А-ЯЁ].

Например, шаблон «[А-ЯЁ]Ж» позволит найти все слова в строке: «Ёж Уж Иж».

Задание 10 14

Для исключения символов из диапазона используется знак «!». Если поставить «!» в квадратные скобки, Word будет искать только те символы, которые не соответствуют указанному в скобках набору.

Например из прошлого примера найдем все слова из двух букв, оканчивающиеся на «ж», но которые не начинаются на «У»

Шаблон: [!У]ж

Строка:   Ёж Уж Иж

Задание 10 15

Фигурные скобки

В синтаксисе регулярных выражений с помощью фигурных скобок указывается диапазон повторений предыдущего символа.

В зависимости от количества аргументов внутри фигурных скобок различают 3 возможных варианта:

  1. {n}строго n повторений предыдущего символа или выражения
  2. {n;} — количество повторений предыдущего символа или выражения больше или равно n
  3. {n;m}от n до m повторений предыдущего символа или выражения

Так, например, шаблону «истин{2}ый» будет соответствовать только одно слово из следующей строки: «Правильно: истинный, неправильно: истиный или истиннный» 

Задание 10 16

Если же после цифры 2 в фигурных скобках поставить точку с запятой, то Word будет искать слова с двумя и более буквами «н».

Шаблон: истин{2;}ый

Строка: Правильно: истинный, неправильно: истиный или истиннный

Задание 10 17

Теперь найдем только те слова, в которых от 1 до 2 букв «н».

Шаблон: истин{1;2}ый

Строка: Правильно: истинный, неправильно: истиный или истиннный

Задание 10 18

Символ @

Работа данного символа будет аналогична записи {1;}. То есть символ @ позволяет найти одно и более повторений предыдущего символа.

Шаблон: деревян@ый

Строка: Как правильно: деревяный или деревянный?

Задание 10 19

Символы < и >

Данные символы служат для обозначения начала и конца слова. Они помогают найти только целые слова или их формы, игнорируя остальные части слов, которые случайно могут подходить под шаблон поиска.

Символ «<» указывает, что искомая фраза должна находиться в начале слова. Он позволяет находить слова, которые начинаются с указанного набора символов, при этом в результаты не будет включена остальная часть слова, следующая за шаблоном.

Найдем фрагмент «код» только у тех слов, которые начинаются на «код-».

Шаблон: <код

Строка: код, кодировать, закодировать, кодификатор

Задание 10 20

Символ «>» указывает, что искомая фраза должна находиться в конце слова. Он позволяет найти слова, которые заканчиваются на указанный набор символов, исключая фрагменты в середине или начале слов.

Найдем фрагмент «байт» только у тех слов, которые оканчиваются на «-байт». 

Шаблон: байт>

Строка: Килобайт Байтовое Мегабайт Байт

Задание 10 21

Найти все слово целиком можно указав в начале и конце искомой строки знаки «<» и «>». 

Например, найдем слова, которые начинаются на «авто-» и далее содержат любое количество символов.

Шаблон: <авто*>

Строка: автобус полуавтомат автомобиль авторизация

Задание 10 22