Здесь находится информация о том, как сдать курс алгоритмов и выжить
Ссылки
- Страница курса в LMS. Здесь находится расписание занятий, список выложенных домашек, дедлайны и т.д.
- Styleguide — обязателен к прочтению и соблюдению.
- Как сдавать домашние задания
- Как настроить окружение на своем компьютере
- Что делать, если решение не проходит в контесте
FAQ
- Как получить доступ к Яндекс.Контесту? На странице курса в LMS есть ссылка на форму, которую нужно заполнить.
- Я заполнил форму, почему ничего не произошло? Доступ даётся не автоматически, должен появиться в течении суток.
- Почему за посылки в Яндекс.Контесте снимаются баллы? Читай вики.
- Почему на компьютере решение работает, а в контесте падает? Читай вики.
Стайлгайд
Основные правила
Прежде, чем писать какой-либо код, обязательно прочитайте C++ Style Guide, на нашем курсе мы требуем полного выполнения Google C++ Style Guide
Какие пункты из Google C++ Style Guide наиболее важны:
- Scoping
- Classes
- Functions
- Parameter Ordering
- Write Short Functions
- Reference Arguments (с оговоркой про выходные параметры примитивных типов в п. 14)
- Other C++ Features
- Naming
- Formatting
Ваша задача на этом курсе — написать наиболее простой, понятный, читаемый и гибкий код среди тех, которые проходят ограничения по времени и по памяти. То есть в первую очередь должна быть правильной асимптотическая сложность, а потом сразу же думайте, как все сделать максимально просто.
Боритесь с дублированием кода
Это самое большое возможное зло. Если в процессе написания вам понадобилось копировать и вставить кусок своего кода в этот же код, то это первый признак того, что происходит дублирование. Постарайтесь детектировать идентичные и похожие места, вынесите общую часть в отдельную функцию или класс и воспользуйтесь ей дважды с разными аргументами.
Старайтесь писать аккуратно
Удаляйте лишний, неиспользуемый, закомментированный код, удаляйте переменные и функции, которые вам на самом деле не нужны, остальные называйте понятно.
Синтаксис
На код должно быть приятно смотреть, его должно быть легко читать. Вы его пишете один раз, сохраняете, после чего его читают много раз, поэтому выгодно потратить при написании немного времени на приведение кода в порядок, чтобы впоследствии сократить своё и чужое время на чтение. Простые правила ниже служат для улучшения визуального восприятия.
-
Используйте 4 пробела для отступа. Данный размер отступа является наиболее распространенным, требуется на курсе C++, поэтому используйте его всюду для единообразия. 4 пробела также является оптимальным размером для отступа согласно NASA.
-
Вокруг всех бинарных операторов (
=, ==, +, -, *, /, >, <<
и др.) должны быть пробелы с обеих сторон. Исключением являются операторы., ->, ::
. -
После запятой должен быть пробел.
-
Между закрывающейся круглой скобкой и открывающейся фигурной должен быть пробел.
-
Не жадничайте с пустыми строками. Вставляйте всегда пустые строки между определениями глобальных функций, классов, констант, typedef'ов, include'ов, между объявлениями методов и функций, между реализациями функций, между объявлениями классов и реализациями функций и т.д.
-
Вставляйте пустые строки в код реализации функций, чтобы подчеркнуть разделение логических частей кода.
-
Не размещайте if, else, for, while и др. на одной строке со своим statement:
if (condition) statement; else statement; ... for (...) statement;
Это, во-первых, ухудшает читаемость кода. Вы можете вообще один из statement'ов не заметить или ошибочно решить, что он относится к if'у:
if (number % 2 == 0) std::cout << "Even\n"; even = true;
А во-вторых, при отладке debugger'ом невозможно понять, выполнив команду «Step Over», выполнилось или не выполнилось условие (или сколько итераций цикла прошло).
-
Также рекомендуется всегда обрамлять
if, else, for, while
фигурными скобками:for (size_t index = 0; index < array.size(); ++index) { statement1; statement2; ... }
for (auto number : array) { statement1; statement2; ... }
даже если внутри только один
statement
.if (number % 2 == 0) { std::cout << "Even\n"; }
Это более читаемо и безопасно. В варианте без скобок легко ошибиться, например, вот так:
if (number % 2 == 0) std::cout << "Even\n"; even = true;
Легко подумать, что код
even = true;
тоже находится под if'ом.
Язык C++
Существуют разные языки программирования: C, C++, Java, Python и великое множество других. Между ними есть очевидные внешние сходства и различия: как написать цикл, как определить оператор, как создать класс. Однако основные их отличия кроются в принятых в них методах решения типовых задач и инструментах: если писать цикл по индексу, то какие должны быть его границы? если определить оператор, каков должен быть тип принимаемых аргументов и возвращаемого значения? если создавать класс, какие переменные-члены стоит в нем определять, какие методы, что следует вынести во внешние функции? На все эти вопросы можно дать разные ответы, и все они будут отчасти верными. Есть и общие рекомендации и конструкции, которые зарекомендовали себя за долгое время использования, как надежные и удобные, а также примеры, как делать не надо. Некоторые из них описаны в этом разделе.
-
using namespace std;
использовать нельзя.Подрообнее
Включать целый namespace опасно, так как из-за этого может возникнуть конфликт имен. Вследствие чего могут возникнуть нетривиальные ошибки компиляции/линковки, а если не повезет, то переменная из namespace может совпасть по названию с какой-то вашей переменной, про которую вы не помните ее область видимости, что приведет к еще более сложнонаходимым багам, хоть все и скомпилируется, но иногда вы будете использовать переменную, думая, что это ваша переменная, и в ней такое-то значение, а значение будет совсем другим. Если нужно использовать много разstd::vector
, напишитеusing std::vector;
еслиcout
, тоusing std::cout;
и т.д. Кроме того, включаяnamespace
, вы нарушаете сам принцип использования namespace'ов. -
Использовать массивы фиксированной длины
int[]
,int*
не рекомендуется — используйте вместо нихstd::vector<int>
. -
Не используйте C-type строки
char[]
иchar*
- используйте вместо нихstd::string
. -
Не используйте ввод-вывод в стиле С через функции scanf, printf.
Подробнее
Используйте вместо них операторы>>
и<<
уstd::cin
иstd::cout
соответственно. Если при этом в задаче большой размер ввода-вывода (от 100000 чисел), то необходимо использовать несколько дополнительных приемов, чтобы ваш ввод-вывод работал достаточно быстро, иначе вы можете получить Time Limit Exceeded. Эти приемы описаны ниже.Пример на пункты 1 — 4:
#include <algorithm> #include <string> #include <vector> using std::string; using std::vector; vector<string> Input() { size_t rows; std::cin >> rows; vector<string> table; table.reserve(rows); for (size_t row = 0; row < rows; ++row) { std::string line; std::cin >> line; table.push_back(line); } return table; } vector<string> Process(vector<string> table) { std::reverse(table.begin(), table.end()); return table; } void Output(const vector<string>& table) { for (const auto& row : table) { std::cout << row << std::endl; } } int main() { std::ios_base::sync_with_stdio(false); std::cin.tie(nullptr); const auto& table = Input(); table = Process(table); Output(table); return 0; }
Важно По умолчанию для
iostream
включен режим совместимости сstdio
, который позволяет одновременно использовать оба интерфейса для ввода/вывода. В этом режиме производительностьstd::cin
иstd::cout
понижается в несколько раз.Подробнее
Поэтому если размер ввода/вывода имеет порядок от 100000 чисел, вам надо будет отключить этот режим. Делать это надо до совершения каких-либо операций ввода-вывода, желательно первой же строкой в программе:#include <iostream> int main() { std::ios_base::sync_with_stdio(false); ... return 0; }
Также обратите внимание на то, что
std::cout
может работать слишком медленно, если вы выводите порядка 100000 чисел или более, и при этом уstd::cout
регулярно очищается буфер. Буфер очищается при каждом выводеstd::endl
, так что в случае большого вывода лучше выводить"\n"
вместоstd::endl
. Также буферstd::cout
очищается при каждом вводе черезstd::cin
— это связано с тем, что при пользовательском вводе-выводе через обычныйstd::cin
иstd::cout
в консоли необходимо перед тем, как запрашивать очередной ввод от пользователя, показать ему последний вывод перед этим, а значит и очистить буфер. Эта проблема для задач с большим выводом решается с помощью вызоваstd::cin.tie(nullptr);
в самом начале программы. Выполнение всех этих рекомендаций приведет к тому, что ввод-вывод при помощи потоковstd::cin
иstd::cout
будет работать не медленнее ввода-вывода черезprintf
иscanf
на задачах с большим вводом-выводом. Подробнее см. здесь. -
Если используется значение типа истина/ложь, то используйте тип
bool
, а неint
. -
Не используйте тип
long
.Подробнее
Более стандартный тип —int
, к нему у всех уже привыкли глаза, иlong
с теми же намерениями — просто смотрится странно. На 32-битных машинах оба типа являются 32-битными и ничем не отличаются, поэтому используйтеint
вместоlong
. Если вам нужен 64-битный тип, придется воспользоваться типомint64_t
. -
При прочих равных, используйте преинкремент
++i
, а не постинкрементi++
. Это полезная привычка. В случае int'ов это все равно, но если у вас будет в коде сложный итератор, то в процессе постинкремента создается его копия в памяти, что может создать вам неожиданные тормоза и повышенное использование памяти, а догадаться о том, что вся проблема — в коротком выраженииit++
— будет сложно. -
main
должен заканчиватьсяreturn 0;
, в противном случае на некоторых компиляторах программа может завершиться с ненулевым кодом возврата, что в свою очередь приводит к Run-time error в тестирующей системе. -
Вставляйте слово
const
везде, где только это возможно по смыслу.Подробнее
Если какая-то переменная по сути меняться в функции не должна, она должна бытьconst
. Если метод класса не меняет при вызове содержимое класса, он должен бытьconst
-методом. Таким образом вы обезопасите себя от многих глупых ошибок: они отловятся еще на этапе компиляции.Если у вас из-за того, что вы где-то поставили в правильном месте
const
, не компилируется код, тоconst
выполнил свою главную задачу. Тогда надо не его убирать, а найти и исправить проблему в другом месте: вы где-то еще забыли поставитьconst
или изменяете переменную, которую не собирались изменять. Надо в этом разобраться, доставитьconst
туда, где он еще нужен, а не удалять там, где он вам «мешает». -
Используйте везде в программе индексацию с нуля.
Подробнее
Если какие-то входные или выходные данные в задаче используют индексацию с единицы, лучше в функции ввода, соответственно вывода, переведите индексацию из одной системы в другую, а везде внутри программы, помимо функций ввода и вывода пользуйтесь индексацией с нуля. Весь язык C++ так спроектирован, что индексация с нуля гораздо удобнее, а как только вы начинаете использовать индексацию с единицы, становится неудобно, появляются вычитания единицы из переменных по всему коду и т.д. -
Задумывайтесь о переполнениях типов. Если у вас есть две переменные типа
int
, значение каждой равно миллиону, и вы их перемножаете, то тип переполнится (максимальное значение — \(2^{31} - 1\)), и вы получите неправильный результат. Необходимо перед перемножением привести обе переменные к 64-битному типуint64_t
. Если у вас есть двеint
переменные со значением два миллиарда и вы их складываете, — тоже произойдет переполнение, тоже нужно предварительно приводить кint64_t
. -
Не вычитайте никогда просто так ничего из
container.size()
, гдеcontainer
— какой-нибудь контейнер из STL.Подробнее
Например,
vector.size()
возвращает беззнаковыйsize_t
(который обычно просто синоним дляunsigned long
), и если вы будете из него вычитать, то можете легко получить переполнение. Например, если вектор пустой, а вы вычитаете единицу, чтобы узнать последний элемент, или вектор состоит только из одного элемента, а вы вычитаете 2, чтобы узнать предпоследний элемент, и т.д. Всегда приводите результат вызоваsize()
к int'у, если вам совершенно необходимо вычесть изsize()
, либо постарайтесь переписать сравнение без операции вычитания. При этом в самом распространенном случае, когда вам нужно написать циклfor
, проходящий по всем элементам, кроме, скажем, последних десяти, надо просто писать не так// Wrong! If container.size() < 10, you'll get an infinite cycle. // This code won't compile with the -Werror flag. for (int index = 0; index < container.size() - 10; ++index) { ... }
В этом цикле, если, к примеру,
container.size() == 5
, то вы получаете реально цикл// Note that 4294967291 > MAX_INT, so the cycle is infinite for (int index = 0; index < 4294967291; ++index) { ... }
А пишите лучше всегда так
// Correct: size_t and adding instead of subtracting for (size_t index = 0; index + 10 < container.size(); ++index) { ... }
ну или хотя бы так
// Correct: casted to int for (int index = 0; index < static_cast<int>(container.size()) - 10; ++index) { ... }
Соответственно, если вам нужно вызвать функцию, в которую вы должны передать индекс первого и последнего элемента вектора, то делайте это так:
SomeFunction(0, static_cast<int>(container.size()) - 1)
По-хорошему, здесь надо бы еще проверять, что в контейнере что-то есть, но к int'у приводить надо в любом случае, иначе появляются неочевидные баги.
-
Не пользуйтесь макросами для определения констант.
Подробнее
Макросы — это очень опасная и неудобная вещь. Их раскрывает специальный препроцессор, который начинает работать еще до компилятора C++, и он ничего не знает о самом языке. Все конструкции раскрываются буквально. В связи с этим есть множество возможных неочевидных побочных эффектов, а у компилятора нет возможности выполнить проверку типов, константность и т.д. Читайте более подробно об этом в книге Майерса «Effective C++».
Итак, неправильный вариант:
#define MAX_LENGTH 100000 // Wrong! Don't use macros!
Правильный вариант:
constexpr int kMaxLegth = 100000; // Correct
-
Входные параметры передавайте в функцию по константной ссылке; по ссылке — чтобы они лишний раз не копировались, по константной — чтобы вы не могли их случайно изменить. Не забывайте про const! Выходные параметры передавайте в функции по указателю — чтобы вы могли их изменить; по указателю, а не по ссылке, — чтобы вы могли в месте вызова отличить входные параметры от выходных по амперсанду перед именем переменной. Размещайте входные параметры перед выходными в списке параметров функции или метода. Аргументы примитивных типов следует передавать в функции по-другому. Входные параметры типов
int
,char
,bool
,double
передавайте по значению. Они будут копироваться, но это так же почти бесплатно, как и в случае ссылок или указателей. При этом вы не сможете их изменить изнутри функции, что и нужно, т.к. это входные параметры. Если вам нужны эти типы как выходные параметры функции, лучше передавайте их по ссылке, т.к. иначе легко внутри функции перепутать указатель на переменную с самой переменной, и сделать совсем не то, что вы собирались.Примеры:
void Input(std::vector<point>* sequence, int& points_to_cover); void FindMaximumsInSlidingWindow( const std::vector<int>& sequence, const std::string& shifts, vector<int>* maximums); double FindMinimumCoveringCircleRadius( const std::vector<point>& points, int points_to_cover);
Примеры вызовов:
std::vector<int> sequence; int points_to_cover; Input(&sequence, points_to_cover); ... ... std::vector<int> sequence; std::string shifts; Input(&sequence, &shifts); std::vector<int> maximums; FindMaximumsInSlidingWindow(sequence, shifts, &maximums); ... ... double min_radius = FindMinimumCoveringRadius(points, points_to_cover);
Обратите внимание на амперсанды & перед переменными, в которые записывается результат вызова функции. Если функция возвращает одну величину, пусть она делает это по значению. Это столь же быстро, зато удобнее в месте вызова. Пример:
std::vector<int> ReadNumbers(std::istream& input_stream = std::cin) { size_t sequence_length; input_stream >> sequence_length; std::vector<int> numbers(sequence_length); for (size_t i = 0; i < numbers.size(); ++i) { input_stream >> numbers[i]; } return numbers; } int main() { std::vector<int> first_sequence = ReadNumbers(); std::vector<int> second_sequence = ReadNumbers(); ... }
Лишнего копирования в этом месте не возникнет. Дело в том, что эта операция настолько часто встречается, что компиляторы научились ее распознавать и генерировать эффективный код для нее. Технология называется return value optimization, известна также под своей аббревиатурой RVO. Можно и следует по умолчанию считать, что она есть и исправно работает, и писать код так, чтобы им было удобнее пользоваться. Чтобы узнать об этом более подробно, поищите в вашем любимом поисковике ее описание по названию. Если переданный на вход параметр для выполнения алгоритма необходимо изменять, — это не означает, что параметр автоматически становится выходным параметром. Если целью алгоритма не является менять входной параметр, то изменять этот параметр функция не должна: пользователь алгоритма этого не ожидает, и будет очень не рад такому побочному эффекту. Кроме того, если просто передать параметр по ссылке и поменять его внутри, то пользователь даже не будет догадываться о том, что переданные им данные будут изменены. Появляющиеся вследствие таких побочных эффектов баги очень тяжело искать. Соответственно, в таких ситуациях есть два решения: передавать параметр по значению или передавать как обычно ко константной ссылке, а внутри функции копировать и изменять уже копию. Первый вариант (передавать по значению) обычно предпочтителен. Т.к. объект передается по значению, его можно менять внутри функции в процессе работы алгоритма (например, сортировать, если это вектор), при этом объект не изменится в месте вызова функции. При копировании аргумента, переданного по константной ссылке, в функции появляется два одинаковых по смыслу объекта, что может привести к путанице и использованию одного из них вместо другого, кроме того, копировать приходится вручную, тогда как при передаче объекта по значению копия делается автоматически, без написания дополнительного кода. Пример:
std::vector<int> Unique(std::vector<int> numbers) { // here we sort a copy of given numbers, // so that the user does not lose his data std::sort(numbers.begin(), numbers.end()); numbers.erase( std::unique(numbers.begin(), numbers.end()), numbers.end()); return numbers; }
-
Разделяйте использование
class
иstruct
: классом должна быть любая сущность, которая содержит в себе логику, тогда как структура — это набор данных, объединенных в один объект. В классе все переменные-члены должны быть приватными, для доступа к ним делайте аксессоры, в структуре все переменные должны быть публичными, нетривиальных методов быть не должно.Пример
struct Point { double x, y; }; // Compares first by x-coordinate, then by y-coordinate bool operator < (const Point& first, const Point& second) { if (first.x != second.x) { return first.x < second.x; } return first.y < second.y; } class Path { public: Path(double time, double average_speed) : time_(time), average_speed_(average_speed) {} double Time() const { return time_; } double AverageSpeed() const { return average_speed_; } double Distance() const { return time_ * average_speed_; } private: double time_; double average_speed_; };
От структуры точки нам ничего не требуется, поэтому она состоит только из двух публичных полей. Метод
compare
добавлять нельзя, задача сравнения решается определением внешнего оператора <. Если нужно, например, запретить изменять координаты (устанавливать их только при создании точки), то ее нужно делать классом с двумя get-аксессорами. В классеPath
хранится две величины, а получать требуется три. Если быtime
иaverageSpeed
были публичными переменными, то доступ к значениям скорости и времени происходил бы какpath.time
иpath.averageSpeed
, а доступ к пройденному расстоянию — какpath.distance()
. Для нахождения расстояния приходится добавлять скобки, то есть всегда приходится помнить о том, что расстояние — это метод, а время и скорость — переменные. Если по какой-то причине (например, недостаточная точность) в будущем хранимые переменные нужно будет поменять и перейти к системе (время, расстояние), то в нашем случае с приватными переменными лишь изменится реализация методов, сохранив интерфейс класса. В случае же с публичными переменными придется изменять интерфейс класса, что немедленно влечет изменение всего кода, который его использует. Хранить все три величины переменными категорически нельзя: если время было равно 1, то действиеpath.time = 0.0
нарушит инвариантtime * speed == distance
, что приведет к совершенно непредсказуемым последствиям. Итак, если вам нужно хранить данные под общим именем, вам подойдет структура; во всех остальных случаях создавайте полноценный класс только с приватными переменные-членами. -
Старайтесь не использовать по возможности динамическое выделение памяти (с помощью
new
иmalloc
):Почему
если вы будете его использовать, вам необходимо будет заботиться и об «уборке мусора», т.е. освобождении памяти. Правильный, безопасный способ это делать — не очень простой и не входит в материалы курса. Кроме того, вызовnew
довольно медленный, поэтому если очень много раз это сделать, то можете не влезть в Time limit. Если вам интересно, как правильно управлять динамической памятью, читайте книгу Майерса «Effective C++» или наберите в поисковике «RAII». -
При использовании
vector
имейте в виду, что у него есть удобные методы: различные конструкторы, позволяющие задать размер и значение элемента вектора по умолчанию, операторы присваивания, сравнения (лексикографического) и операторswap
.Примеры:
Создание двумерного вектора размером
rows * columns
, заполненного значением 100:std::vector< vector<int> > cache( rows, std::vector<int>(columns, 100));
Перестановка двух векторов местами без копирования всего содержимого:
std::vector<int> first(1000000, 1); std::vector<int> second(2000000, 2); first.swap(second);
Здесь меняются местами реально два внутренних указателя
int*
, что значительно эффективнее, чем копирование векторов целиком, особенно если они большого размера. -
Обратите внимание, что для взятия модуля вещественного числа (
float
,double
) необходимо пользоваться функциейfabs
, а неabs
. При этом в Microsoft Visual Studio сделана перегрузкаabs
, которая работает и для вещественных чисел даже если вы не подключили заголовочный файл с ней напрямую. Однако на сервере при этом будетabs(-2.75) != 2.75
.В общем же случае стоит отметить, что в
c++
существует 2 версииabs
:- в
cmath
, определенная для вещественных чисел (float
,double
иlong double
). - в
cstdlib
, определенная для целых чисел (int
,long
иlong long
).
Распространенная ошибка состоит в том, что подключается
cmath
и используетсяabs
оттуда, что приводит к приведению целых типов вdouble
, что в свою очередь может приводить к ошибкам округления при вызовеabs(long long)
.Поэтому общее правило следующее:
- для взятия модуля вещественного числа необходимо подключить
cmath
и использоватьfabs
. - для взятия модуля целого числа необходимо подключить
cstdlib
и использоватьabs
.
- в
-
Если вы пользуетесь новым стандартом
c++11(c++0x)
, то для генерации (псевдо)случайных чисел рекомендуется использовать заголовокrandom
с генератором псевдослучайных чиселstd::mt19937
и распределениями:std::uniform_int_distribution std::uniform_real_distribution
и другими, если понадобятся.
Подробнее
В противном случае, имейте в виду, что значениеRAND_MAX
— ограничения сверху на значения, выдаваемые функциейrand()
,— отличаются в разных компиляторах. Тщательно изучайте, каково значение компилятора в вашем компиляторе, а каково — на компиляторе в автоматической системе (компилятор вы выбираете при сдаче задания). Подходит ли вам такое ограничение сверху, или нужно построить на базе функцииrand()
алгоритм, позволяющий возвращать случайные числа, равномерно распределенные в более широком диапазоне, чем[0, RAND_MAX - 1]
? При использовании схемы, предложенной новым стандартомc++11|(c++0x)
, следует обратить внимание на то, где создавать генератор. Каждый алгоритм должен использовать собственный генератор, чтобы добиться независимой работы всех алгоритмов. Например, два алгоритма, использующих случайность, должны работать одинаково, вне зависимости от порядка их вызовов. Такой независимости сложно добиться при использовании функцииrand()
. Например, если вы хотите реализовать рандомизированный алгоритм сортировки, то нужно создать генератор внутри внешней функции, которую и будет вызывать пользователь, и передать его во внутреннюю, где будет реализована вся логика сортировки:#include <random> template<class Iterator> void Sort(Iterator begin, Iterator end) { std::mt19937 generator; QuickSort(begin, end, generator); } template<class Iterator, class RandomGenerator> void QuickSort(Iterator begin, Iterator end, RandomGenerator& generator) { ... }
-
В большинстве случаев нельзя сравнивать числа типа
float
иdouble
просто операторами <, >, <=, >=, ==:почему
при вычислениях в вещественных типах накапливается погрешность, вследствие чего равные по сути числа, вычисленные с помощью разной последовательности действий, могут получить различные значения в типахfloat
иdouble
, и дажеa < b
может измениться наb < a
. Погрешность вычислений можно оценить, используя точные знания о том, как именно выполняются арифметические операции, а также как происходят вычисления в используемых вами функциях. Обычно делать этого точно не нужно, т.к. точность типаdouble
позволяет хранить 15-16 знаков, а требуемая в задаче точность обычно порядка \(10^{-6}\) или \(10^{-9}\), но не меньше. Однако для того, чтобы корректно сравнивать числа, следует использовать порог сравнения. Примеры:const double COMPARISON_THRESHOLD = 1e-8; bool Less(double first, double second) { return first < second - COMPARISON_THRESHOLD; } bool LessOrEqual(double first, double second) { return first < second + COMPARISON_THRESHOLD; } bool Equal(double first, double second) { return fabs(first - second) < COMPARISON_THRESHOLD; }
-
Для своих типов (классов, структур), если объекты типа необходимо сравнивать между собой, реализуйте всегда
operator<
и не реализуйте остальные операторы сравнения (operator<=, operator>, operator>=
):почему
черезoperator<
выражаются все остальные, и общепринятая конвенция — реализовывать только сравнение на «меньше». В противном случае, дублируется код, а работа различных операторов может оказаться несогласованной. Точно так же, общая конвенция, — что сортировка объектов по умолчанию делается по возрастанию, и в качестве компаратора передается функция сравнения на «меньше». Это правило необходимо соблюдать, чтобы вашу программу было легко понимать другим программистам. -
Не используйте
std::pair
(за исключением случая, описанного ниже).Подробнее:
Причина в том, что в месте использования объектаpair
невозможно понять, что кроется за полемfirst
, а что — за полемsecond
. Это абстрактные названия, которые могут означать что угодно, а в месте использования никаких указаний на это нет. Даже если в месте определения переменной указать, что в ней хранится вfirst
иsecond
, при чтении придется постоянно возвращаться к месту определения переменной, чтобы разобраться в коде и убедиться, в частности, чтоfirst
иsecond
нигде не перепутаны местами — часто встречающаяся ошибка! Исключением являются небольшие участки кода (помещающиеся на один экран), в рамках которых создается из имеющихся объектовpair
, далее удобно используется для какой-нибудь операции (например, сортировка), и затем всеpair
обратно «расшифровываются» в новые объекты и более не используются. Это может быть удобно для сортировки по вторичному параметру, т.к. дляpair
есть оператор сравнения по умолчанию, который сравнивает сначала поfirst
, затем поsecond
. При этом код легко понять, т.к.pair
определен и используется в одном очень локальном куске кода, который можно охватить взглядом целиком.
Организация кода
Как и любая система, код при разрастании становится все более путаным и сложным. Однако есть способы перевести эту сложность преимущественно в его размер, сохраняя логику ясной и прозрачной. Помогает в этом грамотное структурирование: что может быть классом, что должна делать функция, где что должно объявляться. Оно же позволяет удобно осуществить повторное использование нужных участков кода.
-
У каждой переменной должна быть одна-единственная явная цель. Никогда не создавайте переменных
tmp
, выполняющих несколько разных вспомогательных функций во всем коде. Используйте переменную только с одной целью. Переменные, в названии которых используетсяtmp
илиtemp
, почти всегда либо бессмысленные и ненужные, либо неправильно названы. -
Объявляйте переменные как можно ближе к месту их первого использования. Старайтесь сразу же инициализировать переменные. Если переменная используется только внутри функции, она должна быть локальной для функции. Если только внутри цикла, она должна быть локальной для цикла. Никогда не делайте глобальных переменных. Локальные переменные блока предпочтительнее по сравнению с локальными переменными функции, локальные переменные функции — по сравнению с переменными-членами класса, а последние — по сравнению с глобальными переменными. Стремитесь сократить «время жизни» каждой переменной: чем меньше время жизни переменных, тем меньше переменных приходится одновременно держать в голове при чтении и написании кода. Исследования показывают, что человек может эффективно держать в памяти не более 5-7 переменных одновременно. Большее количество неизбежно приводит к ошибкам.
-
Разделяйте программу на ввод, решение и вывод, это делает ваш код более модульным. Способы ввода и вывода часто меняются. У нас используются стандартные потоки и определенный описанный формат, в следующий раз те же данные могут быть записаны в файле или в базе данных в другом формате, затем они же могут поставляться уже в виде переменных в более сложной программе, которая использует ваш алгоритм в качестве подпрограммы. Записывайте вход в отдельные переменные и результат работы — в отдельные. Для их заполнения и вывода напишите отдельные функции. В частности, ваш код становится легче тестируемым, что является важным свойством. Вы можете написать альтернативное решение и сравнить его с вашим, можете запустить стресс-тест. Вообще это две принципиально разные области ответственности: ввод-вывод и преобразование данных. Не смешивайте в одном классе или функции несколько разных областей ответственности: один класс отвечает ровно за одну область. Иначе он разрастается, становится слишком сложным, а две разные области ответственности начинают быть слишком сильно связанными. Это плохо, потому что чем более независимы разные части программы, тем меньше поводов для ошибок и тем проще тестировать части программы по отдельности.
-
Никогда не используйте «магические константы» в коде. Если у вас где-то в коде встречаются, например,
'a'
и'z'
, означающие минимальный и максимальный символ алфавита, то их надо заменить на именованные константы. Например так:const char MIN_LETTER = 'a'; const char MAX_LETTER = 'z'; ... for (char letter = MIN_LETTER; letter <= MAX_LETTER; ++letter) { ... } ...
-
Пишите комментарии только по делу. В идеальном случае лучше обходиться вообще без них — ваш код прокомментирует сам себя. Конечно, так редко удается, поэтому комментарии к классам и функциям бывают полезными. Не нужно оправдывать плохое имя (см. следующий раздел) подробным комментарием. Если у вас встречается объявление вида
int n; // number of balls in the bucket
то нужно заменить его на
int number_of_balls;
илиint numBallsInBucket;
в зависимости от принятого стиля, от того, бывают ли шары не в корзине, и от контекста. Писать комментарий следует над тем, к чему он относится. Комментарии в конце строки значительно удлиняют ее, поэтому ухудшают читаемость. При этом желательно, чтобы строка влезала в 100 символов, а зачастую бывает жесткое ограничение по длине строки (как в нашей системе проверки). Если вы все же пользуетесь комментарием в конце строки, то отделяйте его двумя пробелами от кода. Комментарии к функции должны быть написаны рядом с интерфейсом, а не с реализацией, если они разделены: пользователь будет в первую очередь смотреть на интерфейс, к тому же реализация сторонних библиотек может быть вовсе недоступной. То же самое относится и к классам: комментарии к классу и к его методам должны быть в интерфейсе класса, а не в реализации. Если вы решили снабдить свой код подробными комментариями, указывайте в них то, что будет интересно читающему. Для класса это описание того, для чего класс нужен, как им пользоваться. Для функции и метода — что они делают, что возвращают, что принимают на вход, какие исключения могут бросать. Вот пример хорошего комментария к функции./* Applies per symbol transformation to string. * input[i] is transformed into transform[input[i]]. * If transform map doesn't contain input[i] and defaultSymbol isn't null, * input[i] is transformed to defaultSymbol. * If transform map doesn't contain input[i] and defaultSymbol == 0, * function throws TransformError. */ string TransformString( const string& input, const map<char, char>& transform, const char defaultSymbol);
Имена
У каждой создаваемой сущности в коде есть имя. Сперва автор, а впоследствии, и все читающие код ассоциируют имена с сущностями, которые они обозначают. Чтобы в каждый момент точно понимать, что в переменной хранится, чтобы быть уверенным в том, что вызов функция вернет ожидаемое значение, имена нужно давать осмысленные и грамотно определенные.
-
Имена переменных должны быть длинными и понятными. Каждый раз, когда вы пишете одно-двух-буквенное название переменной или используете что-то вроде cur, должно возникать неприятное чувство. Единственное место, где можно позволить себе однобуквенные переменные, — в качестве счетчика в очень коротком for'е без вложенных циклов. И то, у вас должны быть серьезные опасения, когда вы это делаете, вы должны делать это осознанно. Иначе можно легко допустить ошибку с индексами, например перепутать i с j, что происходит постоянно, если называть так переменные. Искать такую ошибку вы будете несколько часов или дней. Даже если в описании задачи есть названия R и L, это не значит, что в программе нужно их так называть. Стиль математического текста очень сильно отличается от стиля кода программы. В математическом тексте есть очень много слов, описывающих формулы и то, что в них происходит. В самих формулах ценится краткость. В коде же наоборот, слов, описывающих происходящее, практически нет. Код должен описывать сам себя, названиями переменных, методов и классов. Поэтому названия должны быть очень прозрачными. Не должно быть нужно возвращаться и смотреть вверх в объявление переменной или смотреть на ее инициализацию, чтобы понять, что она в себе содержит. Никогда не называйте переменные
something1
иsomething2
, так как очень легко ошибиться и попасть по соседней клавише, тем самым очень легко сделать баг, а искать его будет тяжело. Используйтеsomething_first
иsomething_second
или что-нибудь еще. Как выбрать понятное название переменной? Сперва нужно описать переменную на английском (так чтобы из описания было понятно, что хранит переменная), а далее выбирать название исходя из соображений компромисса между длиной и понятностью. (3-5 слов в названии — это нормально). -
Все, что относится к именам переменных, относится и к именам функций, классов и методов. Кроме того, в названиях методов (функций) обязательно должен быть глагол, описывающий действие, которое выполняет метод. Это действие должно быть одно. У каждой функции должна быть одна ясная цель. Если вы понимаете, что не можете придумать название функции без слова And (например,
ReadFromFileAndSort
), значит, функция выполняет две разные цели, и скорее всего, ее нужно разбить на несколько меньших функций (ReadFromFile
иSort
), и из внешней вызывать подряд внутренние. -
Не сокращайте слова в названиях. Это ухудшает читаемость кода, а также делает невозможным поиск по нему. Не нужно сокращать
index
доind
илиidx
,current
— доcur
и т.д. Единственное исключение — общепринятые сокращения типаHttp
и т.д. -
Выделяйте названия приватных членов классов, это позволяет отличить их от аргументов методов. Наиболее распространенными способами являются подчеркивание в конце:
name_
, — или префиксm_
:m_name
. Начинать имя переменной с подчеркивания не принято; следует помнить о том, что имена, начинающиеся на два подчеркивания или подчеркивание и заглавную букву, зарезервированы стандартом, и использовать их нельзя.
Продвинутые замечания
-
Не оптимизируйте преждевременно. Ваш алгоритм должен иметь правильную асимптотическую сложность, чтобы иметь шансы пройти в Time limit. Он должен правильно работать, чтобы не получить Wrong answer. Это два основных тезиса. Не нужно оптимизировать с целью ускорить программу в константу раз, если это хоть сколько-нибудь усложняет код. Старайтесь сделать свое изначальное решение максимально простым. Оптимизировать нужно только после того, как вы четко замерили время работы программы, убедились, что оно слишком большое, определили, какая именно функция создает узкое место. Даже суперпрофессионалы не берутся заранее предсказывать узкие места системы: в наше время, когда компиляторы умеют делать сумасшедшие оптимизации, это практически невозможно предугадать. Поэтому профессионалы и не пытаются делать это заранее и оптимизировать что-либо заранее. Сначала измерьте, найдите узкое место, а потом уже пытайтесь его оптимизировать. Все вышесказанное относится к выносу переменных из цикла для ускорения, к перебору не до n, а до n / 2 и т.д. — не нужно ничего из этого сделать. Напишите максимально простое решение, добейтесь правильной его работы, и если вдруг после этого оно окажется слишком медленным — только тогда оптимизируйте. Ваша задача в программах, которые вы пишете на этом курсе, — написать наиболее простой, понятный, читаемый и гибкий код, среди тех, которые проходят в ограничения по времени и памяти. Помните об этом и не оптимизируйте, жертвуя простотой и удобством.
-
Не выполняйте никакую сложную работу в конструкторе, также не обращайтесь в конструкторе к каким-либо внешним для программы объектам, таким как файловая система, стандартные потоки ввода и вывода, базы данных и т.д. В конструкторе должна быть только простейшая инициализация полей класса, автономная или в зависимости от параметров конструктора. Это связано с тестированием класса и гибкостью дизайна. На самом деле, почти всегда класс, который легко тестировать, имеет гибкий дизайн и его удобно использовать, и наоборот. Если у класса в конструкторе происходят какие-то сложные действия (обращение к файлу, базе данных или запуск сложного алгоритма), то его сложно протестировать. Чтобы протестировать класс в юнит-тесте, нужно для начала хотя бы создать экземпляр этого класса. Если для этого требуется какой-то файл или база данных, то это уже получается сразу не юнит-тест, т.к. ему для работы нужны внешние данные, внешние объекты, что неудобно, в идеале тест должен быть изолирован от остальной системы для чистоты эксперимента. Подменить данные, лежащие в базе данных или в файле, существенно сложнее, чем передать другие значения параметров в какую-то функцию. Для того, чтобы обойти использование файлов и баз данных, придется переделывать класс, в частности убирать у него из конструктора непосредственные обращения к файлам и базе данных. А если это делается не непосредственно в конструкторе этого класса, а в методах других классов, вызываемых в конструкторе, то придется выносить объекты этих классов наружу и подменять их. Если внутри конструктора сложный алгоритм, то его тоже было бы неплохо протестировать, однако это уже становится невозможно, потому что как только мы захотим создать экземпляр класса, так сразу же вызовем конструктор, и там уже весь алгоритм выполнится, отдельные функции, которые он использует протестировать не получится. Если алгоритм работает неправильно, то к моменту создания объекта класса он будет находиться в некорректном состоянии, и тестировать его будет уже бессмысленно. Иногда даже иметь в классе указатели на объекты других конкретных классов и создавать их в конструкторе неправильно. Например, если класс, выполняющий какой-то конкретный алгоритм, имеет у себя указатель на объект для работы с базой данных, который в конструкторе инициализируется для обращения к конкретной базе, то такой класс тоже невозможно протестировать по вышеописанным причинам. На самом деле, нашему алгоритмическому классу нужны от класса, работающего с базой данных, лишь конкретные данные, которые тот берет из базы данных, и скорее всего далеко не все данные, которые есть в базе. Поэтому имеет смысл написать «обертку» вокруг класса, работающего с базой, которая будет обращаться к базе и доставать произвольные данные с помощью внутреннего класса, работающего непосредственно с базой, а наружу отдавать только те куски данных, которые имеют смысл для алгоритмического класса. А для того, чтобы впоследствии можно было работать не только с базой данных, но те же данные брать из файла или откуда-то из памяти другого объекта, нужно сделать общий интерфейс для классов, поставляющих данные алгоритмическому, и конкретный класс, берущий данные именно из базы, породить от этого интерфейса. Под интерфейсом в данном случае имеется в виду класс с чисто виртуальными методами, который определяет интерфейс всех своих потомков, но инстанцировать который невозможно. Далее, в конструктор алгоритмического класса передавать уже указатель на такой интерфейс, а не указатель на конкретный класс для работы с базой данных, и в конструкторе просто копировать этот указатель во внутреннюю переменную для будущего использования. В таком случае при тестировании можно будет создать mock класса, достающего данные, реализовав этот интерфейс. Наш mock будет «подсовывать» алгоритмическому классу те данные, которые мы хотим, то есть абсолютно любые, что и нужно для полного тестирования. Соответственно, мы сможем проверить реакцию на разные крайние случаи, запустить стресс-тест, понять, какие ограничения на данные должен проверять на входе алгоритмический класс. Нам не придется создавать специальные базы данных для тестирования с подмененными данными, мы сможем генерировать эти данные прямо в памяти, в огромных количествах, сможем выполнить хоть 100000 тестов, если каждый из них выполняется быстро. С базами данных это не получится, потому что, во-первых, один тест, обращающийся в процессе к базе данных, уже в любом случае будет занимать существенное время, а во-вторых потому что не получится создать 100000 различных таблиц.
Более подробное описание, примеры и другие советы для написания хорошо тестируемых классов см. здесь.
Как сдавать домашние задания
На курсе есть несколько видов активностей, которые влияют на вашу оценку:
- задачи, сданные в Контест, в том числе задачи, разобранные на семинарах,
- задачи, по которым нужно проходить код-ревью,
- теоретические домашние задания.
Домашние задания в контесте
Код программ, которые вы будете сдавать в рамках нашего курса, будет проверяться автоматически в системе Яндекс.Контест.
Требования к вводу-выводу
Программа должна читать из стандартного входа и писать в стандартный выход. Входной формат гарантируется: будет так, как описано в условии. Строго придерживайтесь выходного формата. Лишние пробелы и лишние переводы строк — не страшно, а вот пропустить пробел, вывести не в том порядке, пропустить перевод строки или вывести что-то лишнее — будет являться ошибкой.
Вердикты по задаче
Система выдает один из следующих результатов на каждый запуск.
- OK — задача прошла успешно.
- PCF — Precompile check failed — code style violation, вы нарушили какие-то из требований по оформлению кода. Чтобы узнать, какие именно, нажмите на ссылку отчет и почитайте. За эту ошибку не снимаются баллы. Также вы можете получить такую ошибку, если использовали при реализации какую-нибудь стандартную структуру данных или какой-нибудь стандартный алгоритм из библиотеки STL, который в данной задаче было использовать запрещено в условии задачи.
- CE — Compilation Error — ваша программа не компилируется на сервере. Чтобы узнать, почему, нажмите на ссылку «отчет» (она появляется при наведении курсора на строку посылки) и посмотрите, какие ошибки нашел компилятор.
- WA — Wrong Answer — на некотором тесте программа выдала неверный ответ. Вам не предоставляется возможность увидеть, что это был за тест. Внимательно посмотрите на ограничения в задаче, попробуйте придумать свой тест, на котором ответ будет неправильный. -1 балл.
- PE — Presentation Error — ошибка представления. Например, просили вывести число, а выведена строка. В этом случае вы можете получить Wrong Answer либо Presentation error, это не гарантируется заранее. -1 балл.
- TL — Time Limit exceeded — ваша программа работает слишком долго. Значит, у вас неправильное асимптотически решение, так как таймлимиты будут выставляться в 2–3 раза больше, чем время работы авторского решения на максимальном тесте, и этого должно хватать любому правильному решению. -2 балла.
- ML — Memory Limit exceeded — ваша программа использует слишком много памяти. -2 балла.
- RE — Runtime Error — произошла ошибка выполнения. Неочевидные возможные причины: чтение из файла вместо стандартного ввода; запись в файл вместо стандартного вывода; переполнение стека. Очевидные причины: выход за границы массива, деление на ноль. -2 балла.
За тесты из условия баллы не снимаются.
Теоретические домашние задания
Тут всё просто — присылайте pdf файл с решением. Рукописные решения не принимаются, можно использовать шаблон. Можно присылать исправления ДО дедлайна.
Ревью
Проверка задачи на ревью состоит из двух этапов:
- Проверка теоретического решения задачи
- Проверка кода программы
Проверка теоретического решения
Присылайте pdf файл с описанием вашего решения:
- алгоритм решения
- доказательство правильности алгоритма
- временная сложность — асимптотика
- затраты памяти — асимптотика
Все пункты обязательны! Если можете доказать, что быстрее невозможно или меньше памяти использовать невозможно, тоже пишите, это полезно. Рукописные решения не принимаются, можно использовать шаблон.
Ваше решение должно быть написано понятным русским языком, использовать (псевдо)код либо выражения в духе «этой переменной присваиваем то-то» не надо. Излишне подробно расписывать тоже не нужно: решение любой задачи укладывается на одну страницу A4, максимум полторы. Ссылаться на факты, доказанные на лекции, можно и нужно (т.е. не надо заново доказывать, какая сложность у вашей сортировки).
Code Review
После того как сдадите код в систему, нужно будет отправить его на проверку нам. Подробнее о том, как сдавать задания на код-ревью можно посмотреть тут
О сроках. На сдачу теории дается 1 неделя с момента выдачи задачи, и еще 3 недели на то, чтобы пройти все тесты в системе и прислать интерфейс работающей программы на ревью. Затем Code Review идет до тех пор, пока все замечания не будут исправлены, либо не закончится семестр. Рассчитывайте на то, что время ответа ревьюера в среднем составляет 5 рабочих дней, поэтому не затягивайте с отправкой кода и соблюдайте стайлгайд. Все дедлайны будут прописаны на странице курса в lms.
Как настроить окружение на своем компьютере
Введение
С недавнего времени на сервере используется новая схема тестирования решений, а точнее, отлавливается большее число ошибок за счет использования других ключей компиляции. Цель этой заметки — помочь вам получить такой же эффект на своей системе.
Помимо этого, описанные здесь рекомендации позволят вам организовать более качественное тестирование кода.
На сервере компилируется 2 варианта вашего решения, а именно:
clang++ --gcc-toolchain=/usr/local/ -Wall -Werror -Wextra -pedantic -O2 -std=c++20 solution.cpp -o fast_solution
clang++ --gcc-toolchain=/usr/local/ -O2 -std=c++20 -fsanitize=address,undefined solution.cpp -o debug_solution
Здесь стоит отметить следующее:
-Wall
и-Werror
. Первый флаг заставляет компилятор выдавать дополнительные предупреждения, второй — трактовать любое предупреждение как ошибку компиляции. Таким образом, ваш код не должен давать ни одного предупреждения.-O2
включает оптимизации кода.-std=c++20
нужен для использования стандартаC++20
. Если вы не особо обращаете внимание на используемый стандарт, то можете продолжать это делать и писать, как раньше. Остальные могут использовать все фишки нового стандарта.
Во втором случае решение компилируется с включенными санитайзерами. Любое обращение за пределы массива, знаковое переполнение целочисленных типов и любые подобные проявления некорректной работы с памятью и undefined behavior будут вызывать ошибку времени выполнения и приводить к вердикту Runtime Error на сервере, а не ситуации, когда ваша программа иногда работает, а иногда нет.
Обратите внимание, что -fsanitize=address
также включает детектор утечек памяти. Поэтому, помимо контроля над тем, куда обращается ваша программа, на сервере также производится проверка, что в вашей программе нет утечек памяти (сделали new
и не сделали delete
). В подавляющем большинстве случаев вам вообще не нужно оперировать с динамической памятью вручную (например, для создания массивов используйте стандартные контейнеры вроде std::vector
, которые правильно обращаются с памятью).
Поскольку санитайзеры вносят заметный оверхед в решение (значительно увеличивается потребляемая память и в несколько раз может возрасти время исполнения), то они используются только для запуска на маленьких тестах (обычно не более первых десяти в задаче), чтобы правильные решения не могли получить вердикты ML или TL.
Примеры кода
Давайте рассмотрим на примерах, как работает компилятор с указанным выше набором флагов. В этом разделе приведены комментарии по поведению gcc
и clang
в linux с включенными санитайзерами. Про другие ОС см. секции ниже.
Здесь происходит знаковое переполнение при вычислении BAD_MAX_INT
, что порождает соответствующее предупреждение. В десятой строке происходит сравнение int
и size_t
, что также порождает предупреждение. Никогда не игнорируйте это предупреждение: при таком сравнении int
приводится к беззнаковому типу, таким образом, неравенство -1 > size_t
всегда выполнено. Этот код не компилируется с флагом -Werror
.
#include <iostream>
#include <vector>
const int BAD_MAX_INT = (1 << 31) - 1;
int main() {
size_t n;
std::cin >> n;
std::vector<int> data(n);
for (int i = 0; i < data.size(); ++i) {
std::cin >> data[i];
}
return 0;
}
В этом примере происходит очевидный выход за пределы массива. Если заменить динамический массив на std::vector
, произойдет то же самое. И gcc
, и clang
успешно отловят данную ошибку с включенными санитайзерами.
#include <iostream>
#include <vector>
int main() {
size_t n;
std::cin >> n;
int *data = new int[n];
for (size_t i = 0; i < n; ++i) {
std::cin >> data[i];
}
std::cout << data[n] << "\n";
delete[] data;
return 0;
}
В этом примере есть утечка памяти (нет delete[]
)
#include <iostream>
#include <vector>
int main() {
size_t n;
std::cin >> n;
int *data = new int[n];
for (size_t i = 0; i < n; ++i) {
std::cin >> data[i];
}
return 0;
}
Здесь возникает undefined behavior
при переполнении (введем 2000000000 2000000000
), который отловят и clang
и gcc
с включенным флагом -fsanitize=undefined
.
#include <iostream>
int main() {
int a, b;
std::cin >> a >> b;
std::cout << a + b << "\n";
return 0;
}
Настройка на своей системе
Мы рекомендуем использовать среду Clion для разработки. Всем студентам ШАД предоставляется бесплатная лицензия, которую можно найти здесь. Вы можете работать из любой ОС, однако добиться поведения, описанного выше, можно только на Linux и Mac OS. Опыт показывает, что прохождение ШАДа с использованием Windows достаточно мучительно, поэтому лучше заранее озаботиться установкой Linux. Самый удобный вариант — развернуть VirtualBox. Если же у вас Windows 10, то еще одним вариантом будет установка WSL и его интеграция с Clion.
Ниже приведена инструкция для Clion.
Создайте новый проект, зайдите в File -> Settings -> Build,Execution,Deployment -> Cmake. Изначально там будет только один профиль Debug. Когда вы нажмете + добавится профиль Release, который пригодится в дальнейшем. Добавьте еще один профиль, назовите его ASAN. В Cmake Options запишите
-DCMAKE_BUILD_TYPE=ASAN
Отредактируйте ваш CmakeLists.txt
. Он будет выглядеть примерно так:
cmake_minimum_required(VERSION 3.12)
project(my_project)
set(CMAKE_CXX_STANDARD 20)
set(CMAKE_CXX_FLAGS_ASAN "-g -fsanitize=address,undefined -fno-sanitize-recover=all"
CACHE STRING "Compiler flags in asan build"
FORCE)
add_executable(my_project main.cpp)
Теперь вы легко можете переключаться между разными видами сборок: Debug для пошагового дебага, Release для тестирования производительности, ASAN для запуска с санитайзерами.
Windows
На Windows без использования WSL санитайзеры не работают. Вы точно так же можете использовать Clion, но поддержки asan там не будет (если только вы не настроили интеграцию с WSL, см. ссылки выше).
Visual Studio
В Visual Studio полный аналог санитайзеров получить не получится (а именно, undefined), но эмулировать -fsanitize=address
более-менее можно.
Для начала снова рассмотрим код с предупреждениями:
Зайдем в Проект -> Свойства. Дальше для всех конфигураций в свойствах конфигурации нужно выбрать следующий пункт:
Это аналог -Werror
на сервере. Действительно, получаем ошибку компиляции:
То же самое и для конфигурации Release:
Рассмотрим теперь такой код:
#include <iostream>
#include <vector>
int main() {
size_t n;
std::cin >> n;
std::vector<int> data(n);
for (size_t i = 0; i < n; ++i) {
std::cin >> data[i];
}
std::cout << data[n] << "\n";
return 0;
}
Тут есть очевидный выход за границы массива. В Visual Studio в Debug режиме полностью проверяются все операции со стандартными контейнерами. Таким образом, запуск этого кода в Release отработает успешно, а вот в Debug вы получите примерно такую ошибку:
К сожалению, если вы используете просто динамическую память (см. пример кода 2), то даже в Debug режиме все отработает успешно. Это еще один повод использовать стандартные контейнеры.
Рассмотрим теперь третий пример, в котором происходит утечка памяти. В Visual Studio вы можете дописать в начало кода строки:
#define _CRTDBG_MAP_ALLOC
#include <stdlib.h>
#include <crtdbg.h>
Перед выходом из программы (перед return 0
в main например) добавьте строку
_CrtDumpMemoryLeaks();
Программа по-прежнему будет завершаться успешно, но в поток ошибок будет выведено следующее сообщение:
Проверим с delete[]
:
Также обязательно запускайте ваше решение в конфигурации Release, потому что при этом включается -O2
, что может приводить к другому поведению вашей программы (и на сервере тоже) в случае наличия в ней багов.
Mac OS
По сравнению с Linux, на маке необходимо произвести ряд дополнительных действий, чтобы получить такое же поведение. Для начала обязательно установите gcc
из brew
, никогда не используйте системный gcc
. Выполните
brew install gcc
Чтобы проверить, что gcc установился правильно, выполните (10 нужно заменить на версию gсс, установленную brew):
g++-10 --version # выведет полную версию g++
which g++-10 # выведет полный путь к компилятору, например /usr/local/bin/g++-10
Далее необходимо прописать путь к новому компилятору в настройках Clion. Для этого зайдите в File -> Settings -> Build,Execution,Deployment -> Toolchains и в C++ compiler пропишите полный путь к компилятору.
Далее, обратите внимание, что по умолчанию под маком asan не включает проверку на утечки памяти. Чтобы этого избежать, добавьте строчку
export ASAN_OPTIONS=detect_leaks=1
в файл
~/.MacOSX/environment.plist
Иногда на маках при компиляции с asanом может выпадать большое количество ошибок, не связанных с вашим кодом. В этом случае попробуйте добавить флаг -fsanitize-undefined-trap-on-error
для asan-сборки (переменная CMAKE_CXX_FLAGS_ASAN
в CmakeLists.txt
).
Проверка на соответствие стайлгайду и форматирование кода
Инструкция ниже для Linux и Mac OS.
Вам понадобятся утилиты clang-format и clang-tidy, они обычно есть в стандартных репозиториях (apt-get install
или brew install
). Для clang-format вы можете взять конфиг отсюда, а для clang-tidy
отсюда.
Положите эти файлы в директорию с кодом или в домашнюю директорию. Для форматирования кода выполните
clang-format -i main.cpp
Вы также можете настроить автоматическое форматирование кода с помощью этой утилиты в clion.
Для дополнительных проверок на именование переменных, функций и прочего выполните
clang-tidy main.cpp -- -std=c++20
Что делать, если решение не проходит в контесте
Если решение работает локально, а в контесте падает, стоит поискать тест, на котором решение работает неправильно или медленно. Для этого можно запускать стресс-тесты (см. первый семинар в LMS) под санитайзерами.
Ниже перечислены основные причины, почему решение может работать медленно или потреблять много памяти
Медленный ввод-вывод
По умолчанию в C++ для iostream
включен режим совместимости с stdio
, который позволяет одновременно использовать оба интерфейса для ввода/вывода. В этом режиме производительность std::cin
и std::cout
понижается в несколько раз.
Поэтому если размер ввода/вывода имеет порядок от 100 000 чисел, вам нужно будет отключить этот режим. Делать это нужно до совершения каких-либо операций ввода-вывода, желательно первой же строкой в программе:
#include <iostream>
int main() {
std::ios_base::sync_with_stdio(false);
...
return 0;
}
Также обратите внимание на то, что std::cout
может работать слишком медленно, если вы выводите порядка 100 000 чисел или более, и при этом у std::cout
регулярно очищается буфер. Буфер очищается при каждом выводе std::endl
, так что в случае большого вывода лучше выводить "\n"
вместо std::endl
. Также буфер std::cout
очищается при каждом вводе через std::cin
— это связано с тем, что при пользовательском вводе-выводе через обычный std::cin
и std::cout
в консоли, необходимо показать пользователю последний вывод и очистить буфер перед тем как запрашивать очередной ввод. Эта проблема для задач с большим выводом решается с помощью вызова std::cin.tie(nullptr);
в самом начале программы. Выполнение всех этих рекомендаций приведёт к тому, что ввод-вывод при помощи потоков std::cin
и std::cout
будет работать не медленнее ввода-вывода через printf
и scanf
на задачах с большим вводом-выводом. Подробнее см. здесь.
Санитайзеры на маленьких тестах
На нескольких первых маленьких тестах в контесте решение запускается с санитайзером. Санитайзер увеличивает время работы и потреблении памяти программы, поэтому если в решении выделять статический массив максимального размера (например, int arr[100500]
), то решение может упасть с ML.