Skip to content
Open
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
10,000 changes: 10,000 additions & 0 deletions 10_000.txt

Large diffs are not rendered by default.

18 changes: 9 additions & 9 deletions README.md
Original file line number Diff line number Diff line change
Expand Up @@ -44,15 +44,15 @@ puts "MEMORY USAGE: %d MB" % (`ps -o rss= -p #{Process.pid}`.to_i / 1024)"
- в описание `PR` добавьте чеклист и отметьте, что из него сделали; для получения максимальной пользы надо отметить всё.

## Checklist
- [ ] Построить и проанализировать отчёт гемом `memory_profiler`
- [ ] Построить и проанализировать отчёт `ruby-prof` в режиме `Flat`;
- [ ] Построить и проанализировать отчёт `ruby-prof` в режиме `Graph`;
- [ ] Построить и проанализировать отчёт `ruby-prof` в режиме `CallStack`;
- [ ] Построить и проанализировать отчёт `ruby-prof` в режиме `CallTree` c визуализацией в `QCachegrind`;
- [ ] Построить и проанализировать текстовый отчёт `stackprof`;
- [ ] Построить и проанализировать отчёт `flamegraph` с помощью `stackprof` и визуализировать его в `speedscope.app`;
- [ ] Построить график потребления памяти в `valgrind massif visualier` и включить скриншот в описание вашего `PR`;
- [ ] Написать тест, на то что программа укладывается в бюджет по памяти
- [X] Построить и проанализировать отчёт гемом `memory_profiler`
- [X] Построить и проанализировать отчёт `ruby-prof` в режиме `Flat`;
- [X] Построить и проанализировать отчёт `ruby-prof` в режиме `Graph`;
- [X] Построить и проанализировать отчёт `ruby-prof` в режиме `CallStack`;
- [X] Построить и проанализировать отчёт `ruby-prof` в режиме `CallTree` c визуализацией в `QCachegrind`;
- [X] Построить и проанализировать текстовый отчёт `stackprof`;
- [X] Построить и проанализировать отчёт `flamegraph` с помощью `stackprof` и визуализировать его в `speedscope.app`;
- [X] Построить график потребления памяти в `valgrind massif visualier` и включить скриншот в описание вашего `PR`;
- [X] Написать тест, на то что программа укладывается в бюджет по памяти

Не нужно включать в `PR` выводы всех этих отчётов, просто используйте каждый хотя бы по разу в вашем `Case-study`.

Expand Down
55 changes: 0 additions & 55 deletions case-study-template.md

This file was deleted.

62 changes: 62 additions & 0 deletions case-study.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,62 @@
# Case-study оптимизации

## Актуальная проблема
В нашем проекте возникла серьёзная проблема.

Необходимо было обработать файл с данными, чуть больше ста мегабайт.

У нас уже была программа на `ruby`, которая умела делать нужную обработку.

Она успешно работала на файлах размером пару мегабайт, но для большого файла она работала слишком долго, и не было понятно, закончит ли она вообще работу за какое-то разумное время.

Я решил исправить эту проблему, оптимизировав эту программу.

## Формирование метрики
Для того, чтобы понимать, дают ли мои изменения положительный эффект на быстродействие программы я придумал использовать такую метрику: количество память показанное memory_profiler на 30_000 строк
Copy link
Copy Markdown
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

не совсем правильно

memory_profiler - это профилировщик, его нельзя использовать для замера памяти

так как само его использование увеличивает использование памяти

то есть надо всегда разделять два процесса - бенчмаркинг и профайлинг


## Гарантия корректности работы оптимизированной программы
Программа поставлялась с тестом. Выполнение этого теста в фидбек-лупе позволяет не допустить изменения логики программы при оптимизации.

## Feedback-Loop
Для того, чтобы иметь возможность быстро проверять гипотезы я выстроил эффективный `feedback-loop`, который позволил мне получать обратную связь по эффективности сделанных изменений за 30-40 сек

Вот как я построил:
- прогон программы, фиксирование потребляемой оперативной памяти в конце программы
- прогон профайлерами, фиксирование точки роста
- изменения в коде
- тесты


## Вникаем в детали системы, чтобы найти главные точки роста
Для того, чтобы найти "точки роста" для оптимизации я воспользовался memory_profiler, stackprof, ruby-prof

Вот какие проблемы удалось найти и решить

### Ваша находка №1
- memory_profiler на 30_000 строк показывал 3.78 гб аллоцированной памяти.
Copy link
Copy Markdown
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

не актуальное число

- переписать программу иным способом, а именно, не созранять всех юзеров и сессии в памяти, а на лету за один проход все посчитать, собрать report и записать в файл
В первой итерации я так и сделал, так как было понятно, что программа в первоначальном виде не имеет шансов уложится в бюджет по памяти.
Переписал программу "в лоб", не особо задумываясь об потреблении памяти, просто чтобы работало как и было и за один проход по исходному файлу составляла report.
- memory_profiler на 30_000 строк показал результат 43.12 mb (при этом время выполнения программы без профилирования на data_large.txt стало 25 секунд, что меньше, чем лучший результат после оптимизации по CPU)
- главная точка роста стала в String#split

### Ваша находка №2
- ruby prof c RubyProf.measure_mode = RubyProf::MEMORY показал главную точку роста в String#split (52 процента)
- попробовал сделать с блоком в split, чуть уменьшив каждый массив для сессий и юзеров
- memory_profiler на 30_000 строк показал результат 41 mb
- String#split все еще на первом месте, но рядом уже sort_by по строкам дат

### Ваша находка №3
- ruby prof c RubyProf.measure_mode = RubyProf::MEMORY показал главную точку роста в Enumerable#sort_by (31 процент)
- использовал SortedSet
- memory_profiler на 30_000 строк показал результат 41 mb
- Enumerable#sort_by пропал из топа

Еще добавил magic comment.
Поменял где надо массивы на Set.

## Результаты
В результате проделанной оптимизации наконец удалось обработать файл с данными.

## Защита от регрессии производительности
Для защиты от потери достигнутого прогресса при дальнейших изменениях программы написал performance rspec тест
Binary file added massif.jpg
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
7 changes: 7 additions & 0 deletions memory_profiler_runner.rb
Original file line number Diff line number Diff line change
@@ -0,0 +1,7 @@
require 'memory_profiler'
require_relative 'task-2'

report = MemoryProfiler.report do
work(file_name: ENV['FILE_NAME'], gc_disabled: false)
end
report.pretty_print(scale_bytes: true)
34 changes: 34 additions & 0 deletions mini_test.rb
Original file line number Diff line number Diff line change
@@ -0,0 +1,34 @@
require_relative 'task-2.rb'
require 'minitest/autorun'

class TestMe < Minitest::Test
def setup
File.write('result.json', '')
File.write('data.txt',
'user,0,Leida,Cira,0
session,0,0,Safari 29,87,2016-10-23
session,0,1,Firefox 12,118,2017-02-27
session,0,2,Internet Explorer 28,31,2017-03-28
session,0,3,Internet Explorer 28,109,2016-09-15
session,0,4,Safari 39,104,2017-09-27
session,0,5,Internet Explorer 35,6,2016-09-01
user,1,Palmer,Katrina,65
session,1,0,Safari 17,12,2016-10-21
session,1,1,Firefox 32,3,2016-12-20
session,1,2,Chrome 6,59,2016-11-11
session,1,3,Internet Explorer 10,28,2017-04-29
session,1,4,Chrome 13,116,2016-12-28
user,2,Gregory,Santos,86
session,2,0,Chrome 35,6,2018-09-21
session,2,1,Safari 49,85,2017-05-22
session,2,2,Firefox 47,17,2018-02-02
session,2,3,Chrome 20,84,2016-11-25
')
end

def test_result
work
expected_result = JSON.parse('{"totalUsers":3,"uniqueBrowsersCount":14,"totalSessions":15,"allBrowsers":"CHROME 13,CHROME 20,CHROME 35,CHROME 6,FIREFOX 12,FIREFOX 32,FIREFOX 47,INTERNET EXPLORER 10,INTERNET EXPLORER 28,INTERNET EXPLORER 35,SAFARI 17,SAFARI 29,SAFARI 39,SAFARI 49","usersStats":{"Leida Cira":{"sessionsCount":6,"totalTime":"455 min.","longestSession":"118 min.","browsers":"FIREFOX 12, INTERNET EXPLORER 28, INTERNET EXPLORER 28, INTERNET EXPLORER 35, SAFARI 29, SAFARI 39","usedIE":true,"alwaysUsedChrome":false,"dates":["2017-09-27","2017-03-28","2017-02-27","2016-10-23","2016-09-15","2016-09-01"]},"Palmer Katrina":{"sessionsCount":5,"totalTime":"218 min.","longestSession":"116 min.","browsers":"CHROME 13, CHROME 6, FIREFOX 32, INTERNET EXPLORER 10, SAFARI 17","usedIE":true,"alwaysUsedChrome":false,"dates":["2017-04-29","2016-12-28","2016-12-20","2016-11-11","2016-10-21"]},"Gregory Santos":{"sessionsCount":4,"totalTime":"192 min.","longestSession":"85 min.","browsers":"CHROME 20, CHROME 35, FIREFOX 47, SAFARI 49","usedIE":false,"alwaysUsedChrome":false,"dates":["2018-09-21","2018-02-02","2017-05-22","2016-11-25"]}}}')
assert_equal expected_result, JSON.parse(File.read('result.json'))
end
end
16 changes: 16 additions & 0 deletions performance_spec.rb
Original file line number Diff line number Diff line change
@@ -0,0 +1,16 @@
require 'rspec-benchmark'
require_relative 'task-2.rb'

RSpec.configure do |config|
config.include RSpec::Benchmark::Matchers
end

describe 'Performance' do
let(:file_name) { '10_000.txt' }

it 'allocates less then 12mb' do
expect do
work(file_name: file_name)
end.to perform_allocation(12 * 1024 * 1024).memory
end
end
1 change: 1 addition & 0 deletions result.json

Large diffs are not rendered by default.

20 changes: 20 additions & 0 deletions ruby_prof_memory.rb
Original file line number Diff line number Diff line change
@@ -0,0 +1,20 @@
require 'ruby-prof'
require_relative 'task-2'

RubyProf.measure_mode = RubyProf::MEMORY

result = RubyProf.profile do
work(file_name: ENV['FILE_NAME'], gc_disabled: true)
end

printer = RubyProf::FlatPrinter.new(result)
printer.print(File.open('ruby_prof_memory_reports/flat.txt', 'w+'))

printer = RubyProf::DotPrinter.new(result)
printer.print(File.open('ruby_prof_memory_reports/graphiz.dot', 'w+'))

printer = RubyProf::GraphHtmlPrinter.new(result)
printer.print(File.open('ruby_prof_memory_reports/graph.html', 'w+'))

printer = RubyProf::CallStackPrinter.new(result)
printer.print(File.open('ruby_prof_memory_reports/callstack.html', 'w+'))
20 changes: 20 additions & 0 deletions ruby_prof_printers.rb
Original file line number Diff line number Diff line change
@@ -0,0 +1,20 @@
require 'ruby-prof'
require_relative 'task-2'

RubyProf.measure_mode = RubyProf::ALLOCATIONS

result = RubyProf.profile do
work(file_name: ENV['FILE_NAME'], gc_disabled: true)
end

printer = RubyProf::FlatPrinter.new(result)
printer.print(File.open('ruby_prof_reports/flat.txt', 'w+'))

printer = RubyProf::DotPrinter.new(result)
printer.print(File.open('ruby_prof_reports/graphiz.dot', 'w+'))

printer = RubyProf::GraphHtmlPrinter.new(result)
printer.print(File.open('ruby_prof_reports/graph.html', 'w+'))

printer = RubyProf::CallStackPrinter.new(result)
printer.print(File.open('ruby_prof_reports/callstack.html', 'w+'))
3 changes: 3 additions & 0 deletions runner.rb
Original file line number Diff line number Diff line change
@@ -0,0 +1,3 @@
require_relative 'task-2'

work(file_name: ENV['FILE_NAME'])
6 changes: 6 additions & 0 deletions stackprof_report.rb
Original file line number Diff line number Diff line change
@@ -0,0 +1,6 @@
require 'stackprof'
require_relative 'task-2'

StackProf.run(mode: :object, out: 'stackprof_reports/stackprof.dump', raw: true) do
work(file_name: ENV['FILE_NAME'], gc_disabled: true)
end
Loading