Темы статей
Выбрать темы

Поиск дубликатов в базе данных

Редакция БК
Ответы на вопросы

Поиск дубликатов в базе данных

 

Уважаемые сотрудники «Б & К»! Подскажите, как в базе данных Excel быстро найти повторяющиеся значения? Такую задачу мне приходится решать, например, при составлении различного рода справочников или просто для контроля правильности данных. Думаю, что этот вопрос будет интересен не только мне, но и другим вашим читателям. Заранее благодарю.

А. Пархоменко, г. Харьков

Отвечает

Николай КАРПЕНКО, канд. техн. наук, доцент кафедры прикладной математики и информационных технологий Харьковской национальной академии городского хозяйства

 

Для бухгалтера контроль правильности данных важен, как никогда. Ведь объем информации в бухгалтерских расчетах обычно большой. Эту информацию приходится многократно копировать, сортировать, переносить с одного листа на другой. И каждый раз есть вероятность ошибиться! Например,  случайно продублировать несколько лишних записей. В результате данные будут искажены, дальнейшие расчеты делать уже бессмысленно. Вовремя обнаружить такую ошибку среди нескольких тысяч строк без специальных приемов практически невозможно. И в этом есть основная проблема. Досадно потратить несколько часов драгоценного времени, а затем увидеть в базе несколько лишних значений и все расчеты начинать с нуля… Сегодня мы поговорим о нескольких практических приемах, которые помогут избежать такой ситуации. Эти приемы я покажу на примере базы данных, изображенной на рис. 1. В ней я оставил всего три поля — наименование товара, единицу измерения и остаток на текущую дату. Наша задача — найти в базе повторяющиеся наименования и проверить, нужны ли они на самом деле. Решить такую задачу можно разными способами. На мой взгляд, наиболее эффективным будет использование сортировки, формул и условного форматирования.

img 1

 

Поиск дубликатов при помощи формул

Это наиболее простой вариант. Чтобы воспользоваться им, делаем так:

1. Открываем документ, ставим указатель активной ячейки внутрь базы данных.

2. Вызываем меню «

Данные → Сортировка…». Появится окно, как на рис. 2.

img 2

3. В этом окне щелкаем на поле «Сортировать по», из предложенного списка выбираем «Наименование». Переключатель направления сортировки можно оставить по умолчанию в положении «по возрастанию». В нашей базе есть заголовки, поэтому переключатель «Идентифицировать диапазон данных по» оставляем в положении «подписям (первая строка диапазона)».

4. В окне «Сортировка диапазона» нажимаем «ОК». Excel отсортирует базу по возрастанию значений в поле «Наименование». В результате все одинаковые записи будут собраны вместе, увидеть их уже будет легче. Но мы пойдем дальше.

5. В ячейку «D1» вводим любой заголовок (в примере на рис. 3 эта колонка называется «Пр».).

6. В ячейку «D2» вводим формулу «=A2=A1».

7. Копируем формулу на всю высоту таблицы. Окончательный вид документа с формулой показан на рис. 3.

img 3

Нам остается бегло просмотреть таблицу. Все повторяющиеся наименования будут отмечены значением «ИСТИНА» в колонке «Пр».

Вкратце по поводу формулы. В выражении «=A2=A1» первый символ «=» — это признак начала формулы. Второй символ «=» — это логический оператор (проверка на равенство). Формула сравнивает значения в ячейках «A1» и «A2» (т. е. текущей ячейки и той, что расположена на одну позицию выше). Если содержимое совпадает, формула вернет значение «ИСТИНА». В противном случае результатом работы формулы будет «ЛОЖЬ». Это и есть наглядный признак повторяющихся записей. При желании для сравнения можно воспользоваться функцией «ЕСЛИ()». В этом случае формула для ячейки «D1» могла бы выглядеть так: «=ЕСЛИ(A2=A1;”*”;””)». После копирования формулы на всю высоту таблицы повторяющиеся значения будут отмечены символом «*».

 

Поиск дубликатов условным форматированием

В некоторых случаях работа с формулой для выявления повторяющихся записей может быть нежелательной. Тогда можно обратиться к инструменту условного форматирования. Делаем так.

1. Открываем документ с базой данных (рис. 1).

2. Через меню «

Данные → Сортировка…» сортируем таблицу по полю «Наименование» (рис. 2).

3. Щелкаем на ячейке «

A2» (первое значение в колонке наименований).

4. Вызываем меню «

Формат → Условное форматирование…».

5. В одноименном окне щелкаем на значке выпадающего списка «

Условие 1», выбираем значение «Формула» (рис. 4)

img 4

6. В поле для ввода формулы печатаем выражение «=A2=A1» (рис. 4).

7. Щелкаем на кнопке «Формат…». Откроется окно «Формат ячеек» (рис. 5).

img 5

8. В окне форматирования выбираем оформление для ячеек, которые попадают под действие заданного условия. Например, красный шрифт полужирного начертания и светло-желтый цвет фона.

9. В окне «Формат ячеек» нажимаем «ОК».

10. В окне «Условное форматирование» нажимаем «ОК».

11. Оставаясь на ячейке «A2», щелкаем на инструменте «Формат по образцу» (он расположен на панели инструментов «Форматирование», (рис. 6)).

img 6

12. Удерживая левую кнопку мыши, выделяем заполненные ячейки в колонке «А». Все повторяющиеся значения в столбце «Наименование» будут оформлены красным цветом на желтом фоне (рис. 7). Все, что остается сделать, — просмотреть фрагменты таблицы, выделенные цветом и проанализировать их.

img 7

 

Удачной работы! Жду ваших вопросов, замечаний и предложений на

bk@id.factor.ua или на nictomkar@rambler.ru .
App
Скачайте наше мобильное приложение Factor

© Factor.Media, 1995 -
Все права защищены

Использование материалов без согласования с редакцией запрещено

Ознакомиться с договором-офертой

Присоединяйтесь
Адрес
г. Харьков, 61002, ул. Сумская, 106а
Мы принимаем
ic-privat ic-visa ic-visa

Мы используем cookie-файлы, чтобы сделать сайт максимально удобным для вас и анализировать использование наших продуктов и услуг, чтобы увеличить качество рекламных и маркетинговых активностей. Узнать больше о том, как мы используем эти файлы можно здесь.

Спасибо, что читаете нас Войдите и читайте дальше