hardcode-dev · stashevgenij · Jul 3, 2022 · Jul 3, 2022 · Jul 3, 2022 · Jul 3, 2022
diff --git a/.DS_Store b/.DS_Store
diff --git a/.gitignore b/.gitignore
@@ -0,0 +1,2 @@
+data_large.txt
+result.json
diff --git a/case-study-template.md b/case-study-template.md
@@ -12,44 +12,65 @@
 Я решил исправить эту проблему, оптимизировав эту программу.
 
 ## Формирование метрики
-Для того, чтобы понимать, дают ли мои изменения положительный эффект на быстродействие программы я придумал использовать такую метрику: *тут ваша метрика*
+Для того, чтобы понимать, дают ли мои изменения положительный эффект на быстродействие программы я придумал использовать такую метрику:
+
+Вывод объема затрачиваемой памяти с помощью
+```ps -o rss= -p #{Process.pid}```
+
+На файле 8 000 строк получилось 59 MB.
 
 ## Гарантия корректности работы оптимизированной программы
 Программа поставлялась с тестом. Выполнение этого теста в фидбек-лупе позволяет не допустить изменения логики программы при оптимизации.
 
 ## Feedback-Loop
-Для того, чтобы иметь возможность быстро проверять гипотезы я выстроил эффективный `feedback-loop`, который позволил мне получать обратную связь по эффективности сделанных изменений за *время, которое у вас получилось*
+Для того, чтобы иметь возможность быстро проверять гипотезы я выстроил эффективный `feedback-loop`, который позволил мне получать обратную связь по эффективности сделанных изменений за 30-60 секунд
+
+Вот как я построил `feedback_loop`:
+
+Использую тот же общий фидбек луп как и в прошлом задании, который уже доказал свою эффективность :)
+
+`while metrics < budget do`
 
-Вот как я построил `feedback_loop`: *как вы построили feedback_loop*
+- Профилирование
+- Точка роста
+- Изменения, направленные на оптимизацию главной точки роста
+- Метрика
+- Повторное рофилирование - понять как повлияло на точку роста
+- Коммит
+
+`end`
 
 ## Вникаем в детали системы, чтобы найти главные точки роста
-Для того, чтобы найти "точки роста" для оптимизации я воспользовался *инструментами, которыми вы воспользовались*
+Для того, чтобы найти "точки роста" для оптимизации я воспользовался ```memory_profiler```, ```stackprof (text)```, ```ruby_prof```
 
 Вот какие проблемы удалось найти и решить
 
-### Ваша находка №1
-- какой отчёт показал главную точку роста
-- как вы решили её оптимизировать
-- как изменилась метрика
-- как изменился отчёт профилировщика
+### Ваша находка №1 - пересоздание массива сессий
+
+- ```memory_profiler```
+- добавлять элементы в уже существующий массив с помощью метода ```<<```
+- потребление уменьшилось с 59 до 43
+- появилась новая точка роста
 
-### Ваша находка №2
-- какой отчёт показал главную точку роста
-- как вы решили её оптимизировать
-- как изменилась метрика
-- как изменился отчёт профилировщика
+### Ваша находка №2 - отчёты по юзерам
+```report['usersStats'][user_key] = report['usersStats'][user_key].merge(block.call(user))```
 
-### Ваша находка №X
-- какой отчёт показал главную точку роста
-- как вы решили её оптимизировать
-- как изменилась метрика
-- как изменился отчёт профилировщика
+- ```stackprof``` в терминале
+- Использование bang метода чуть-чуть улучшает ситуацию, но этого совсем не хватает, а в целом куча объектов размещается из-за вызовов ```collect_stats_from_users```. Встаёт вопрос о целесообразности рефакторить эти вызовы, если скрипт будем переписывать на потоковое чтение, поэтому сразу перейдём к нему.
+
+### Ваша находка №3 - стриминг файлов
+- точка роста та же
+- переписать программу на потоковое чтение и запись файлов
+- в конце программы при любом объёме файла потребляется 19 мб мемори
+- новая точка роста ```String#split```
 
 ## Результаты
 В результате проделанной оптимизации наконец удалось обработать файл с данными.
-Удалось улучшить метрику системы с *того, что у вас было в начале, до того, что получилось в конце* и уложиться в заданный бюджет.
+Удалось улучшить метрику системы с 59мб и бесконечного роста в зависимости от объёма файла до 20мб на любом объёме и уложиться в заданный бюджет.
+
+Попробовал все инструменты профилирования. В том числе проверил через ```Valgrind```, разбуханий не обнаружил, пруфы имеются :)
 
-*Какими ещё результами можете поделиться*
+![](./profiling/valgrind.jpg)
 
 ## Защита от регрессии производительности
-Для защиты от потери достигнутого прогресса при дальнейших изменениях программы *о performance-тестах, которые вы написали*
+Для защиты от потери достигнутого прогресса при дальнейших изменениях программы написал тест с помощью матчера ```perform_allocation```, но не понял как точно он считает, потому что ```ps``` показывает 20мб, а ```perform_allocation``` 1.3мб.