→ Как сравнить содержимое двух текстовых документов. Сравнение Подготовка примера данных

Как сравнить содержимое двух текстовых документов. Сравнение Подготовка примера данных

Во время работы с текстовыми документами часто приходится сравнивать их по содержанию. Эта необходимость возникает, если над документом работали несколько человек или документ был отправлен учителю на согласование и редактирование, нужно быстро найти все сделанные второй стороной изменения. Но и сам пользователь может создать несколько копий документа и запутаться: какая версия последняя, и какие исправления были внесены. Рассмотрим все возможности быстрого, а главное автоматического сравнения двух документов.

1. Сравнение двух документов в MSWord (начиная с версий программы MSWord 2007, 2010, 2013)

Воспользуемся функцией Юридическое примечание , позволяющей выполнять автоматическое сравнение документов.

Запускаем программу MS Word. На ленте открываем вкладку Рецензирование , выбираем раздел Сравнить и раскрываем возможные варианты команды Сравнить… (смотри на Рисунок 1), выбираем первую команду – Сравнение двух версий документа (Юридическое примечание) .

Рисунок 1 Запуск автоматического СРАВНЕНИЯ двух текстовых документов

Откроется окно, в котором указываете путь к хранению исходного и измененного документов. Для указания пути необходимо воспользоваться пиктограммой с изображением желтой папки, как показано на Рисунке 2.

Рисунок 2 Внешний вид окна Сравнение версий


Командная кнопка Больше>> (Рисунок 2) предоставляет больше дополнительных настроек отображения (подсвечивания) выполненных изменений. При ее активации окно Сравнения версий примет следующий вид (смотри Рисунок 3)

Рисунок 3 Дополнительные возможности при автоматическом сравнении текстовых документов


В открывшемся окне в разделе Параметры сравнения отметить галочками те изменения, которые необходимо отобразить в процессе автоматического сравнения документов.

По умолчанию окно Сравнения выглядит следующим образом.

Рисунок 4. Окно автоматического сравнения двух версий документа


Рассмотрим области окна автоматического сравнения документов в Юридическом примечании.

  • Слева приводится Сводка исправлений: что именно было исправлено и кем (если имя пользователя указано в настройках Word).
  • В центре – Сравниваемый документ – документ с внесенными исправлениями (показываются красным: добавление и удаление слов).
  • Справа сверху: исходный документ , а ниже – измененный документ.

Область сверки Сводка исправлений можно настроить в виде горизонтальной панели рецензирования. Для этого необходимо выполнить последовательно следующие команды: вкладыш Рецензирование => Область проверки => Горизонтальная панель рецензирования.

Рисунок 5. Настройка Горизонтальной панели рецензирования

В этом случае окно автоматического сравнения двух документов будет выглядеть следующим образом

Рисунок 6. Окно автоматического сравнения документов при горизонтальной панели рецензирования


Перемещаться по исправлениям можно как с помощью левой клавиши мыши, кликая на текст в нужном месте документа, так и с помощью Вкладки Рецензирование – Область проверки.

Рисунок 7 Работаем с опцией ИЗМЕНЕНИЯ


Выявленные изменения необходимо либо Принять , чтобы оно осталось в измененном документе и больше не показывалось как исправление, либо Отклонить , если не согласны. Передвигаться по исправлениям можно с использованием клавиш: Назад и Далее (смотри Рисунок 7).

Чтобы отклонить или принять все исправления, используем команду Принять (или Отклонить) . С помощью левой клавиши мыши раскрываем список опций команды Принять/Отклонить (стрелочка вниз) и из предложенных вариантов выбираем нужную, например: Применить (Отклонить) все исправления в документе.

Рисунок 8 Окно команды ПРИНЯТЬ

2. Сравнение двух блоков текста в интернет-браузере

При сравнении содержимого двух документов также можно воспользоваться специализированными сервисами, предоставляемыми интернет-браузерами. Они удобны при определении различий в текстах как англоязычных документов, так и при работе с русскоязычными текстами, например: Text-Compare (http://text-compare.com/), TextDiff (http:// www.textdiff.com/) и Quick Diff (http://www.quickdiff.com/). С их помощью можно сравнивать фрагменты текста, таблицы и даже программный код.

Рассмотрим кратко технологию сравнения документов в каждом из трех рекомендуемых сервисов. Общим для них является размещение двух фрагментов в соответствующие окна, а затем инициализация процесса сравнения.

Text-Compare (http://text-compare.com/). Для сравнения двух фрагментов в данном сервисе достаточно скопировать эти фрагменты в соответствующие окна, а затем запустить процесс сравнения (командная кнопка Compare ). Различающиеся, а также отсутствующие в одном из сравниваемых документов фрагменты текста будут выделенными (отличающиеся элементы выделяются цветом при сравнении таблиц, в программных кодах при сравнении дополнительно отмечаются строки с отличиями).

Рисунок 9 Окна Text-Compare до выполнения операции сравнения и после ее выполнения


TextDiff (http://www.textdiff.com/). Окно сервиса представляет собой два окна, в которые помещаются сравниваемые фрагменты текста, таблицы или программного кода.

Рисунок 10 Окно сервиса TextDiff


Результаты отображения процесса сравнения с использованием TextDiff представляют один результирующий фрагмент, в котором зеленым цветом выделяется текст, появившийся во втором фрагменте (то есть отсутствующий в первом), а красным – удаленный текст.

Сравним с предыдущим сервисом: при сравнении текстовых блоков и небольших таблиц такой результат может быть удобен, для сравнения больших таблиц такой результат – сложный для вычитки различий, поскольку найденные различия отображаются построчно в текстовом формате без номеров строк и сохранения видимости столбцов.

Рисунок 11 Результата сравнения с использованием сервиса TextDiff


Принцип представления результатов в Quick Diff точно такой же, как и в TextDiff. Отличие состоит в том, что удаленные из второго фрагмента данные не только отображаются другим цветом, но еще и зачеркиваются. При этом к сложностям сравнения текста добавляется проблема – некорректное распознавание кириллицы (смотри Рисунок 12).

Рисунок 12.Окно сервиса Quick Diff после выполнения операции сравнения


Подведем итоги:

  1. сервис Text-Compare может использоваться для сравнения текстов, таблиц и программного кода безо всяких ограничений;
  2. сервис TextDiff может использоваться для сравнения текстов, программных кодов и небольших табличных фрагментов;
  3. сервис Quick Diff прекрасно сравнивает тексты (не на русском языке), программные коды и может использоваться для сравнения небольших табличных фрагментов.

Материал подготовлен Шутилиной Л.А., методистом ГМЦ ДОгМ

7. Принимаем решение: поскольку значение статистики (0,581 > 0,560) попало в критическую область – нулевая гипотеза отвергается, и в качестве рабочей принимается альтернативная, т.е. значение 1080 с вероятностью 0,95 и по критерию Диксона можно считать грубой погрешностью.

Заметим, однако, как и по критерию Н.В. Смирнова, высказать подобное утверждение с вероятностью 0,99 по критерию Диксона мы не имеем права, посколь-

ку по таблицам (r10) 0,01;6 = 0,698.

3.5. Сравнение двух рядов наблюдений

При проведении и анализе результатов экспериментальных исследований часто приходится сравнивать две партии изделий, показания двух или не-

скольких приборов, анализировать результаты работы однотипных агрегатов, сравнивать результаты исследований двух проб материалов и т.д. Вот некоторые примеры подобных ситуаций.

1. Необходимо сравнить показания двух приборов, измеряющих одну и ту же величину, когда этими рабочими средствами измерений получено два ряда наблюдений данной величины. Одинакова ли точность измерения одного и того же технологического параметра разными приборами?

2. Требуется поверить рабочее средство измерения (т.е. определить, не выходят ли погрешности его измерений за пределы регламентированных значений) с помощью образцового средства измерения. Равно ли математическое ожидание показаний данного прибора действительному значению измеряемого параметра?

3. Два агрегата выпускают одну и ту же продукцию. Необходимо сделать

вывод о том, какой из них лучше или хуже в каком-либо смысле.

Решение подобных задач осуществляется также с использованием аппа-

рата проверки статистических гипотез. Ведь если нам необходимо было бы сравнить две случайные величины X и Y , имеющие нормальное распределе-

ние, при известных их математических ожиданиях и дисперсиях M x ; σ x 2 и M y ;

σ y 2 , то вопрос, очевидно, решался бы достаточно просто. Две случайные вели-

чины с нормальным распределением равны между собой (имеют одинаковое распределение, т.е. имеют одну и ту же функцию распределения F (X ) = F (Y ) или плотность распределения f (X ) = f (Y )), когда равны между собой их математические ожидания (M x = M y ) и дисперсии (σ x 2 = σ y 2 ), поскольку только эти два параметра полностью определяют нормальное (двухпараметрическое) распре-

деление (см. (2.12) или (2.21)).

Однако, как это уже неоднократно ранее отмечалось, любой из параметров распределения случайной величины Θ может быть найден лишь по всей генеральной совокупности, т.е. только теоретически при проведении бесконечно большого количества опытов. Практически, по выборке ограниченного объема, исследователь может определить только приближенное значение параметра – его оценку Θ*. При этом вероятность того, что оценка Θ* совпадет со зна-

чением оцениваемого параметра Θ, очень мала. Следовательно, даже если равны между собой параметры распределений двух случайных величин (Θx =

Θy ), то их оценки скорее всего не будут одинаковыми (Θx * ≠ Θy *).

Поэтому при сравнении двух случайных величин обычно приходится высказывать и проверять нулевую гипотезу Н0 : Θx = Θy , при альтернативных гипо-

тезах типа Н1 (1) : Θx < Θy или Н1 (2) : Θx > Θy . Н1 (3) : Θx ≠ Θy ,

3.5.1. Сравнение двух дисперсий

При выполнении измерений в различных условиях часто возникает задача сравнения степени разброса (дисперсий) исследуемых параметров (случайных величин).

Проверка гипотезы о равенстве дисперсий имеет большое значение, так

как измеряемая дисперсией величина рассеяния характеризует такие исключи-

тельно важные показатели, как точность машин, приборов, стабильность технологических процессов, качество готовой продукции и т.д. Поэтому, например, о преимуществах той или иной технологии или о качестве выпускаемой продук-

ции вывод можно часто сделать в результате сравнения дисперсий тех параметров, которые их характеризуют.

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

Таким образом, требуется установить, являются ли выборочные дисперсии S 1 2 ≠ S 2 2 со степенями свободы m1 и m2 значимо отличающимися или же они характеризуют выборки, взятые из одной и той же генеральной совокупности или из генеральных совокупностей с равными дисперсиями (σ1 2 = σ2 2 = σ2 ).

В этом случае нулевая гипотеза формулируется в виде H0 : σ1 2 = σ2 2 = σ2 , т.е. между двумя генеральными дисперсиями различия нет при заданном уровне значимости α.

Для проверки этой гипотезы используется критерий, основанный на распределении Фишера, зависящем только от числа степеней свободы m1 и m2 . Аналитическое выражение критерия Фишера имеет вид

F=(S1 2 /σ1 2 )/(S2 2 /σ2 2 ) = (S1 2 /S2 2 )/(σ2 2 /σ1 2 ).

Плотность распределения величины Fm1, m2 , представленная на рис. 3.7,

есть функция

−1

при F ≥ 0;

m F (m1 + m2 ) / 2

f (F) =

F < 0.

Надо иметь в виду, что скорость возрастания и убывания функции, а также величина и положение максимума зависят от параметров m1 и m2 .

Соответствующая функция распределения величины Fm1, m2 определяется через плотность распределения

F (F ) = ∫ F

f (ξ ) dξ .

Существуют статистические таблицы как с табулированными значениями

функции распределения Фишера для принятого уровня значимости, так и с табулированными значениями квантилей этого распределения (см. табл. П.4 и

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

m2 =∞

m1 =20

m2 =25

m2 =10

m2 =∞ m2 =25

m2 =10

m1 =20

Рис. 3.7. Плотность (а) и функция (б) F-распределения (частный случай при m1 =20

Поскольку по условию нуль–гипотезы σ1 2 = σ2 2 , то выражение можно представить как отношение выборочных дисперсий

F=S1 2 /S2 2 ,

где S1 2 > S2 2 .

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

Если при проверке нулевой гипотезы H0 : σ1 2 = σ2 2 = σ2 альтернативной является гипотеза H1 (1) : σ1 2 > σ2 2 , то применяют одностороннее неравенство

F=S1 2 /S2 2 > Fα ,m1,m2 .

Для альтернативной гипотезы H1 (2) : σ1 2 ≠ σ2 2 , когда соотношение между генеральными дисперсиями неизвестно, различие между дисперсиями считают значимым, если выполняется условие

F=S 12 /S 22 > F (α /2),m1,m2.

Таким образом, алгоритм решения задачи сводится к следующему.

Пусть по результатам испытаний двух независимых выборок объемом n 1 и n 2 из нормально распределенных совокупностей подсчитаны оценки дисперсий S 1 2 и S 2 2 , причем S 1 2 > S 2 2 . Требуется проверить предположение (нулевую

гипотезу Н0 ) о том, что указанные выборки принадлежат генеральным совокупностям с равными дисперсиями.

В соответствии с общим алгоритмом проверки любой статистической гипотезы:

1. Н 0 : σ 1 2 = σ 2 2 = σ 2 .

2. Возможно два варианта альтернативной гипотезы:

Н1 (1) : σ 1 2 ≠ σ 2 2 ;

Н1 (2) : σ 1 2 > σ 2 2 .3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

5. Границы критической области можно установить по таблицам квантилей F - распределения (см. или табл. П.4, П.5, а в Microsoft Excel для этого используется функция FРАСПОБР ) для числа степеней свободы m 1 = n 1 -1 и m 2 = n 2 - 1 и уровня значимости

1 (1) : σ 1 2 ≠ σ 2 2 уровень значимости равен

α/2 и критическая область определяется соотношением F > F (α / 2), m 1 , m 2 ;

при альтернативной гипотезе Н 1 (2) : σ 1 2 > σ 2 2 уровень значимости равен α и критическая область определяется соотношением F > F α , m 1 , m 2 .

6. Нулевую гипотезу принимают, т.е. полагают, что σ 1 2 = σ 2 2 = σ 2 при выполнении одного из неравенств (для различных альтернативных гипотез):

F ≤ F

при Н1 (1) σ 1 2 ≠ σ 2 2 ;

(α / 2),m ,m

F ≤ F

при Н1 (2) : σ 1 2 > σ 2 2 .

α , m , m

В случае подтверждения нулевой гипотезы, по двум выборочным дис-

персиям производят оценку общей генеральной дисперсии σ 2

S 2 =

− 1)S 2

+ (n

− 1)S 2

n 1 + n 2

− 2

которая может быть использована для дальнейшего анализа опытных данных.

Проиллюстрируем применение критерия Фишера на следующем приме-

Пример 3.4. Проводятся измерения одной и той же физической величи-

ны (температуры, давления, состава газа и т.п.). Первым (старым) измеритель-

ным прибором выполнено 200 измерений, которые дали выборочную дисперсию S1 2 = 3,82, а вторым (новым) сделано только 15 измерений при выборочной дисперсии S2 2 = 2,00. Можно ли считать, что разброс в показаниях нового прибора существенно ниже, чем у старого?

1. Сформулируем нулевую гипотезу о равенстве дисперсий Н0 : σ 1 2 =σ 2 2 =

σ2 .

2. Выберем альтернативную ей гипотезу Н1 : σ 1 2 > σ 2 2 .

Всем известно, что "Ворд" - это многофункциональный текстовый редактор. Множество его возможностей и вовсе выходит далеко за рамки В этой статье будет рассказано о том, как сравнить два файла Word в самой программе. Процедура эта довольна простая, однако мало кто о ней вообще знает. Пригодиться она может в разных случаях, например, когда на компьютере есть два файла: ваша работа и ее черновик. Чтобы не ошибиться и не отправить заказчику черновик, лучше всего использовать именно сравнение двух файлов.

Шаг 1: подготовительный этап

Примечательно, что после того, как вы сравните два файла, они останутся неизмененными, а все несоответствия будут показаны в другом (новом) документе, который откроется автоматически. Но обо всем по порядку. Для начала разберемся, что нужно делать в первую очередь перед тем, как сравнить два файла Word.

Первым делом необходимо подготовиться. Перед тем как сравнить два файла Word, их необходимо открыть. Поэтому отыщите их на своем компьютере и кликните два раза по ним.

Теперь нужно в одном из файлов открыть нужный нам инструмент. Находится он во вкладке "Рецензирование" в группе инструментов "Сравнение". Называется инструмент "Сравнить", поэтому нажмите на него и в выпадающем меню выберите одноименный пункт.

Итак, вы на месте, теперь можно переходить непосредственно к тому, как сравнить два файла Word на различия или совпадения.

Шаг 2: выбор сравниваемых документов

Перед вами сейчас открыто окно под названием "Сравнение версий". В нем, как вы видите, есть две области: "Исходный документ" и "Измененный документ". Соответственно, в первую вы должны поместить оригинал документа, а во вторую - его исправленную версию.

Чтобы выбрать документ, вам необходимо нажать на значок папки рядом с После нажатия откроется проводник, в котором нужно проложить путь к искомому файлу. После того как это сделано, повторите действия и для второго файла.

Вот мы и выбрали нужные документы для сравнения, однако не спешите нажимать кнопку "ОК", чтобы начался процесс анализа. Для того чтобы получить желаемый результат, лучше будет задать нужные параметры. О том, как это сделать, сейчас и поговорим.

Шаг 3: задаем нужные параметры для сравнения

Итак, перед тем как сравнить два файла Word, разумнее будет задать параметры, на которые будет опираться анализ. Это позволит обнаружить те несоответствия, которые вы хотите найти.

Чтобы открыть меню параметров, вам нужно нажать на кнопку "Больше", все в том же окне "Сравнение версий".

В меню, которое развернулось, вы можете наблюдать кучу настроек. Сейчас давайте обратим внимание на группу "Параметры сравнения". В ней вам нужно выбрать те элементы, которые будут сопоставляться в двух документах. К слову, чем меньше галочек установлено, тем быстрее пройдет процесс сравнения. Поэтому, если вы ищете изменения в форматировании, будет разумно выделить лишь этот пункт, в то время как другие убрать.

В группе "Показывать изменения" выберите, в чем именно искать их: в знаках или словах. Также не забудьте указать, в каком из документов показывать результат. В исходнике, измененном файле или новом.

После того как вы зададите все необходимые вам параметры, можно смело нажимать кнопку "ОК", чтобы начался процесс анализа. Длится он не очень долго, даже если были выбраны все пункты сравнения.

Шаг 4: проверка результата

В итоге вам покажут результат. В зависимости от вашего выбора он будет продемонстрирован в одном из двух документов или в новом, третьем.

Места, которые не совпадают, будут помечены красной линией. Что очень удобно - нажав на линию, вам будут продемонстрировано различие. Оно будет перечеркнуто красной линией.

К слову, если вы не знали, как сравнить два файла Word на совпадения, то, к сожалению, такого сделать не получится в программе. Однако для этой цели можно использовать специальные сервисы.

 

 

Это интересно: