WikiSort.ru - Не сортированное

ПОИСК ПО САЙТУ | о проекте

Дублирование кода — термин из программирования, под которым понимается, что некоторые участки исходного кода могут встречаться более чем однажды, как внутри одной, так и в нескольких программных сущностях. Дублирование является симптомом так называемого «дурно пахнущего кода».^[1] В первую очередь потому, что увеличивается его длина; именно из-за дублирования, а не из-за совпадений. Последовательность дубликатов иногда называют клонами.

Вот список причин, по которым две части кода могут считаться дубликатами:

посимвольное совпадение
посимвольное совпадение, с игнорированием пробельных символов и комментариев
совпадение по токенам (лексемам)
частичное совпадение по лексемам
функциональное совпадение

Откуда берутся дубликаты кода

Вот ряд причин, по которым дубликаты кода могут быть созданы:

Программирование копированием-вставками, при котором участки кода копируются просто потому, что «это работает». В большинстве случаев такая операция требует небольших изменений переносимого кода, например, переименования переменных или добавление/удаление некоторых участков.
Требуется функциональность, которая очень похожа на уже существующую в другой части программы, и программист пишет код, очень близкий к тому, который уже существует.
Плагиат, когда код просто копируется без соблюдения прав или каких-либо условий.

Проблемы, к которым приводят дубликаты кода

Дублирование кода является признаком низкого или ленивого стиля программирования. Хороший стиль программирования обычно основан на повторном использовании кода. Может казаться, что использование дубликатов позволит несколько ускорить процесс создания программы, так как программисту не нужно будет задумываться над тем, как код уже используется и как он может использоваться в дальнейшем. Однако, проблема заключается в том, что написание кода — это лишь скромная часть жизненного цикла продукта, и дальнейшее сопровождение кода с дубликатами будет слишком осложнено. Вот несколько проблем, к которым приводит дублирование кода:

Большое количество кода затрудняет его понимание: Дублирование кода часто приводит к созданию длинных, повторяющихся последовательностей кода, которые отличаются лишь несколькими строками или символами.
Скрытое значение: Трудно уловить разницу в повторяющихся участках кода и поэтому становится тяжелее понимать, для чего именно предназначен тот или иной кусочек кода. Зачастую единственная разница заключается в параметрах. Лучший выход из данной ситуации лежит в использовании процедур и функций.
Аномалии обновления: Дублирование кода противоречит основному принципу теории баз данных, а именно: Избегайте избыточности. Невыполнение этого принципа приводит к аномалиям обновления, которые сильно увеличивают затраты на обслуживание кода. В этом случае одно и то же изменение нужно ввести во все дубликаты. И, в лучшем случае, время, потраченное на внесение изменений и тестирование кода увеличивается пропорционально количеству дубликатов. А в худшем — некоторые места в коде могут быть пропущены, и исправление всех ошибок может затянуться на месяцы или даже годы. Старайтесь использовать библиотеки кода в такой ситуации.
Размер файла: Без применения какого-либо сжатия файл исходника будет занимать больше места на диске.

Поиск дубликатов кода

Существует определенное количество алгоритмов, позволяющих отыскать дубликаты кода. Например:

Алгоритм Бейкер (Baker’s algorithm).^[2].
Алгоритм Рабина — Карпа.
Использование абстрактных синтаксических деревьев^[3].
Визуальное определение дубликатов^[4].

Примеры дубликатов кода

Приведём следующий фрагмент кода, который вычисляет среднее значение массива целых чисел.

extern int array1[];
extern int array2[];

int sum1 = 0;
int sum2 = 0;
int average1;
int average2;
int i;

for (i = 0; i < 4; ++i)
  sum1 += array1[i];

average1 = sum1/4;

for (i = 0; i < 4; ++i)
  sum2 += array2[i];

average2 = sum2/4;

В этом примере два цикла могут быть выделены в отдельную функцию:

int calcAverage (int* Array_of_4)
{
  int sum = 0;

  for (int i = 0; i < 4; ++i)
    sum += Array_of_4[i];

  return sum/4;
}

Использование этой функции избавит код от дубликатов:

extern int array1[];
extern int array2[];

int average1 = calcAverage(array1);
int average2 = calcAverage(array2);

См. также

Примечания

↑ Spinellis, Diomidis The Bad Code Spotter's Guide (неопр.). InformIT.com. Проверено 6 июня 2008. Архивировано 10 сентября 2012 года.
↑ Brenda S. Baker. A Program for Identifying Duplicated Code. Computing Science and Statistics, 24:49-57, 1992
↑ Ira D. Baxter, et al. Clone Detection Using Abstract Syntax Trees
↑ Visual Detection of Duplicated Code Архивная копия от 29 июня 2006 на Wayback Machine by Matthias Rieger, Stephane Ducasse.

Ссылки

The University of Alabama at Birmingham: Code Clones Literature (англ.)

Данная страница на сайте WikiSort.ru содержит текст со страницы сайта "Википедия".

Если Вы хотите её отредактировать, то можете сделать это на странице редактирования в Википедии.

Если сделанные Вами правки не будут кем-нибудь удалены, то через несколько дней они появятся на сайте WikiSort.ru .

Текст в блоке "Читать" взят с сайта "Википедия" и доступен по лицензии Creative Commons Attribution-ShareAlike; в отдельных случаях могут действовать дополнительные условия.

Другой контент может иметь иную лицензию. Перед использованием материалов сайта WikiSort.ru внимательно изучите правила лицензирования конкретных элементов наполнения сайта.

2019-2026
WikiSort.ru - проект по пересортировке и дополнению контента Википедии

[1] Spinellis, Diomidis The Bad Code Spotter's Guide (неопр.). InformIT.com. Проверено 6 июня 2008. Архивировано 10 сентября 2012 года.

[2] Brenda S. Baker. A Program for Identifying Duplicated Code. Computing Science and Statistics, 24:49-57, 1992

[3] Ira D. Baxter, et al. Clone Detection Using Abstract Syntax Trees

[4] Visual Detection of Duplicated Code Архивная копия от 29 июня 2006 на Wayback Machine by Matthias Rieger, Stephane Ducasse.