benchmark/src/complexity.cc

5dda2efdSMircea Trofin// Copyright 2016 Ismael Jimenez Martinez. All rights reserved.
5dda2efdSMircea Trofin//
5dda2efdSMircea Trofin// Licensed under the Apache License, Version 2.0 (the "License");
5dda2efdSMircea Trofin// you may not use this file except in compliance with the License.
5dda2efdSMircea Trofin// You may obtain a copy of the License at
5dda2efdSMircea Trofin//
5dda2efdSMircea Trofin//     http://www.apache.org/licenses/LICENSE-2.0
5dda2efdSMircea Trofin//
5dda2efdSMircea Trofin// Unless required by applicable law or agreed to in writing, software
5dda2efdSMircea Trofin// distributed under the License is distributed on an "AS IS" BASIS,
5dda2efdSMircea Trofin// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
5dda2efdSMircea Trofin// See the License for the specific language governing permissions and
5dda2efdSMircea Trofin// limitations under the License.
5dda2efdSMircea Trofin
5dda2efdSMircea Trofin// Source project : https://github.com/ismaelJimenez/cpp.leastsq
5dda2efdSMircea Trofin// Adapted to be used with google benchmark
5dda2efdSMircea Trofin
a290770fSMircea Trofin#include "complexity.h"
5dda2efdSMircea Trofin
5dda2efdSMircea Trofin#include <algorithm>
5dda2efdSMircea Trofin#include <cmath>
a290770fSMircea Trofin
a290770fSMircea Trofin#include "benchmark/benchmark.h"
5dda2efdSMircea Trofin#include "check.h"
5dda2efdSMircea Trofin
5dda2efdSMircea Trofinnamespace benchmark {
5dda2efdSMircea Trofin
5dda2efdSMircea Trofin// Internal function to calculate the different scalability forms
5dda2efdSMircea TrofinBigOFunc* FittingCurve(BigO complexity) {
5dda2efdSMircea Trofin  static const double kLog2E = 1.44269504088896340736;
5dda2efdSMircea Trofin  switch (complexity) {
5dda2efdSMircea Trofin    case oN:
5dda2efdSMircea Trofin      return [](IterationCount n) -> double { return static_cast<double>(n); };
5dda2efdSMircea Trofin    case oNSquared:
5dda2efdSMircea Trofin      return [](IterationCount n) -> double { return std::pow(n, 2); };
5dda2efdSMircea Trofin    case oNCubed:
5dda2efdSMircea Trofin      return [](IterationCount n) -> double { return std::pow(n, 3); };
5dda2efdSMircea Trofin    case oLogN:
5dda2efdSMircea Trofin      /* Note: can't use log2 because Android's GNU STL lacks it */
*a5b79717SMircea Trofin      return [](IterationCount n) {
*a5b79717SMircea Trofin        return kLog2E * std::log(static_cast<double>(n));
*a5b79717SMircea Trofin      };
5dda2efdSMircea Trofin    case oNLogN:
5dda2efdSMircea Trofin      /* Note: can't use log2 because Android's GNU STL lacks it */
5dda2efdSMircea Trofin      return [](IterationCount n) {
*a5b79717SMircea Trofin        return kLog2E * static_cast<double>(n) *
*a5b79717SMircea Trofin               std::log(static_cast<double>(n));
5dda2efdSMircea Trofin      };
5dda2efdSMircea Trofin    case o1:
5dda2efdSMircea Trofin    default:
5dda2efdSMircea Trofin      return [](IterationCount) { return 1.0; };
5dda2efdSMircea Trofin  }
5dda2efdSMircea Trofin}
5dda2efdSMircea Trofin
5dda2efdSMircea Trofin// Function to return an string for the calculated complexity
5dda2efdSMircea Trofinstd::string GetBigOString(BigO complexity) {
5dda2efdSMircea Trofin  switch (complexity) {
5dda2efdSMircea Trofin    case oN:
5dda2efdSMircea Trofin      return "N";
5dda2efdSMircea Trofin    case oNSquared:
5dda2efdSMircea Trofin      return "N^2";
5dda2efdSMircea Trofin    case oNCubed:
5dda2efdSMircea Trofin      return "N^3";
5dda2efdSMircea Trofin    case oLogN:
5dda2efdSMircea Trofin      return "lgN";
5dda2efdSMircea Trofin    case oNLogN:
5dda2efdSMircea Trofin      return "NlgN";
5dda2efdSMircea Trofin    case o1:
5dda2efdSMircea Trofin      return "(1)";
5dda2efdSMircea Trofin    default:
5dda2efdSMircea Trofin      return "f(N)";
5dda2efdSMircea Trofin  }
5dda2efdSMircea Trofin}
5dda2efdSMircea Trofin
5dda2efdSMircea Trofin// Find the coefficient for the high-order term in the running time, by
5dda2efdSMircea Trofin// minimizing the sum of squares of relative error, for the fitting curve
5dda2efdSMircea Trofin// given by the lambda expression.
5dda2efdSMircea Trofin//   - n             : Vector containing the size of the benchmark tests.
5dda2efdSMircea Trofin//   - time          : Vector containing the times for the benchmark tests.
*a5b79717SMircea Trofin//   - fitting_curve : lambda expression (e.g. [](ComplexityN n) {return n; };).
5dda2efdSMircea Trofin
5dda2efdSMircea Trofin// For a deeper explanation on the algorithm logic, please refer to
5dda2efdSMircea Trofin// https://en.wikipedia.org/wiki/Least_squares#Least_squares,_regression_analysis_and_statistics
5dda2efdSMircea Trofin
*a5b79717SMircea TrofinLeastSq MinimalLeastSq(const std::vector<ComplexityN>& n,
5dda2efdSMircea Trofin                       const std::vector<double>& time,
5dda2efdSMircea Trofin                       BigOFunc* fitting_curve) {
5dda2efdSMircea Trofin  double sigma_gn_squared = 0.0;
5dda2efdSMircea Trofin  double sigma_time = 0.0;
5dda2efdSMircea Trofin  double sigma_time_gn = 0.0;
5dda2efdSMircea Trofin
5dda2efdSMircea Trofin  // Calculate least square fitting parameter
5dda2efdSMircea Trofin  for (size_t i = 0; i < n.size(); ++i) {
5dda2efdSMircea Trofin    double gn_i = fitting_curve(n[i]);
5dda2efdSMircea Trofin    sigma_gn_squared += gn_i * gn_i;
5dda2efdSMircea Trofin    sigma_time += time[i];
5dda2efdSMircea Trofin    sigma_time_gn += time[i] * gn_i;
5dda2efdSMircea Trofin  }
5dda2efdSMircea Trofin
5dda2efdSMircea Trofin  LeastSq result;
5dda2efdSMircea Trofin  result.complexity = oLambda;
5dda2efdSMircea Trofin
5dda2efdSMircea Trofin  // Calculate complexity.
5dda2efdSMircea Trofin  result.coef = sigma_time_gn / sigma_gn_squared;
5dda2efdSMircea Trofin
5dda2efdSMircea Trofin  // Calculate RMS
5dda2efdSMircea Trofin  double rms = 0.0;
5dda2efdSMircea Trofin  for (size_t i = 0; i < n.size(); ++i) {
5dda2efdSMircea Trofin    double fit = result.coef * fitting_curve(n[i]);
*a5b79717SMircea Trofin    rms += std::pow((time[i] - fit), 2);
5dda2efdSMircea Trofin  }
5dda2efdSMircea Trofin
5dda2efdSMircea Trofin  // Normalized RMS by the mean of the observed values
*a5b79717SMircea Trofin  double mean = sigma_time / static_cast<double>(n.size());
*a5b79717SMircea Trofin  result.rms = std::sqrt(rms / static_cast<double>(n.size())) / mean;
5dda2efdSMircea Trofin
5dda2efdSMircea Trofin  return result;
5dda2efdSMircea Trofin}
5dda2efdSMircea Trofin
5dda2efdSMircea Trofin// Find the coefficient for the high-order term in the running time, by
5dda2efdSMircea Trofin// minimizing the sum of squares of relative error.
5dda2efdSMircea Trofin//   - n          : Vector containing the size of the benchmark tests.
5dda2efdSMircea Trofin//   - time       : Vector containing the times for the benchmark tests.
5dda2efdSMircea Trofin//   - complexity : If different than oAuto, the fitting curve will stick to
5dda2efdSMircea Trofin//                  this one. If it is oAuto, it will be calculated the best
5dda2efdSMircea Trofin//                  fitting curve.
*a5b79717SMircea TrofinLeastSq MinimalLeastSq(const std::vector<ComplexityN>& n,
5dda2efdSMircea Trofin                       const std::vector<double>& time, const BigO complexity) {
a290770fSMircea Trofin  BM_CHECK_EQ(n.size(), time.size());
a290770fSMircea Trofin  BM_CHECK_GE(n.size(), 2);  // Do not compute fitting curve is less than two
5dda2efdSMircea Trofin                             // benchmark runs are given
a290770fSMircea Trofin  BM_CHECK_NE(complexity, oNone);
5dda2efdSMircea Trofin
5dda2efdSMircea Trofin  LeastSq best_fit;
5dda2efdSMircea Trofin
5dda2efdSMircea Trofin  if (complexity == oAuto) {
5dda2efdSMircea Trofin    std::vector<BigO> fit_curves = {oLogN, oN, oNLogN, oNSquared, oNCubed};
5dda2efdSMircea Trofin
5dda2efdSMircea Trofin    // Take o1 as default best fitting curve
5dda2efdSMircea Trofin    best_fit = MinimalLeastSq(n, time, FittingCurve(o1));
5dda2efdSMircea Trofin    best_fit.complexity = o1;
5dda2efdSMircea Trofin
5dda2efdSMircea Trofin    // Compute all possible fitting curves and stick to the best one
5dda2efdSMircea Trofin    for (const auto& fit : fit_curves) {
5dda2efdSMircea Trofin      LeastSq current_fit = MinimalLeastSq(n, time, FittingCurve(fit));
5dda2efdSMircea Trofin      if (current_fit.rms < best_fit.rms) {
5dda2efdSMircea Trofin        best_fit = current_fit;
5dda2efdSMircea Trofin        best_fit.complexity = fit;
5dda2efdSMircea Trofin      }
5dda2efdSMircea Trofin    }
5dda2efdSMircea Trofin  } else {
5dda2efdSMircea Trofin    best_fit = MinimalLeastSq(n, time, FittingCurve(complexity));
5dda2efdSMircea Trofin    best_fit.complexity = complexity;
5dda2efdSMircea Trofin  }
5dda2efdSMircea Trofin
5dda2efdSMircea Trofin  return best_fit;
5dda2efdSMircea Trofin}
5dda2efdSMircea Trofin
5dda2efdSMircea Trofinstd::vector<BenchmarkReporter::Run> ComputeBigO(
5dda2efdSMircea Trofin    const std::vector<BenchmarkReporter::Run>& reports) {
5dda2efdSMircea Trofin  typedef BenchmarkReporter::Run Run;
5dda2efdSMircea Trofin  std::vector<Run> results;
5dda2efdSMircea Trofin
5dda2efdSMircea Trofin  if (reports.size() < 2) return results;
5dda2efdSMircea Trofin
5dda2efdSMircea Trofin  // Accumulators.
*a5b79717SMircea Trofin  std::vector<ComplexityN> n;
5dda2efdSMircea Trofin  std::vector<double> real_time;
5dda2efdSMircea Trofin  std::vector<double> cpu_time;
5dda2efdSMircea Trofin
5dda2efdSMircea Trofin  // Populate the accumulators.
5dda2efdSMircea Trofin  for (const Run& run : reports) {
a290770fSMircea Trofin    BM_CHECK_GT(run.complexity_n, 0)
a290770fSMircea Trofin        << "Did you forget to call SetComplexityN?";
5dda2efdSMircea Trofin    n.push_back(run.complexity_n);
*a5b79717SMircea Trofin    real_time.push_back(run.real_accumulated_time /
*a5b79717SMircea Trofin                        static_cast<double>(run.iterations));
*a5b79717SMircea Trofin    cpu_time.push_back(run.cpu_accumulated_time /
*a5b79717SMircea Trofin                       static_cast<double>(run.iterations));
5dda2efdSMircea Trofin  }
5dda2efdSMircea Trofin
5dda2efdSMircea Trofin  LeastSq result_cpu;
5dda2efdSMircea Trofin  LeastSq result_real;
5dda2efdSMircea Trofin
5dda2efdSMircea Trofin  if (reports[0].complexity == oLambda) {
5dda2efdSMircea Trofin    result_cpu = MinimalLeastSq(n, cpu_time, reports[0].complexity_lambda);
5dda2efdSMircea Trofin    result_real = MinimalLeastSq(n, real_time, reports[0].complexity_lambda);
5dda2efdSMircea Trofin  } else {
*a5b79717SMircea Trofin    const BigO* InitialBigO = &reports[0].complexity;
*a5b79717SMircea Trofin    const bool use_real_time_for_initial_big_o =
*a5b79717SMircea Trofin        reports[0].use_real_time_for_initial_big_o;
*a5b79717SMircea Trofin    if (use_real_time_for_initial_big_o) {
*a5b79717SMircea Trofin      result_real = MinimalLeastSq(n, real_time, *InitialBigO);
*a5b79717SMircea Trofin      InitialBigO = &result_real.complexity;
*a5b79717SMircea Trofin      // The Big-O complexity for CPU time must have the same Big-O function!
*a5b79717SMircea Trofin    }
*a5b79717SMircea Trofin    result_cpu = MinimalLeastSq(n, cpu_time, *InitialBigO);
*a5b79717SMircea Trofin    InitialBigO = &result_cpu.complexity;
*a5b79717SMircea Trofin    if (!use_real_time_for_initial_big_o) {
*a5b79717SMircea Trofin      result_real = MinimalLeastSq(n, real_time, *InitialBigO);
*a5b79717SMircea Trofin    }
5dda2efdSMircea Trofin  }
5dda2efdSMircea Trofin
5dda2efdSMircea Trofin  // Drop the 'args' when reporting complexity.
5dda2efdSMircea Trofin  auto run_name = reports[0].run_name;
5dda2efdSMircea Trofin  run_name.args.clear();
5dda2efdSMircea Trofin
5dda2efdSMircea Trofin  // Get the data from the accumulator to BenchmarkReporter::Run's.
5dda2efdSMircea Trofin  Run big_o;
5dda2efdSMircea Trofin  big_o.run_name = run_name;
5dda2efdSMircea Trofin  big_o.family_index = reports[0].family_index;
5dda2efdSMircea Trofin  big_o.per_family_instance_index = reports[0].per_family_instance_index;
5dda2efdSMircea Trofin  big_o.run_type = BenchmarkReporter::Run::RT_Aggregate;
5dda2efdSMircea Trofin  big_o.repetitions = reports[0].repetitions;
5dda2efdSMircea Trofin  big_o.repetition_index = Run::no_repetition_index;
5dda2efdSMircea Trofin  big_o.threads = reports[0].threads;
5dda2efdSMircea Trofin  big_o.aggregate_name = "BigO";
a290770fSMircea Trofin  big_o.aggregate_unit = StatisticUnit::kTime;
5dda2efdSMircea Trofin  big_o.report_label = reports[0].report_label;
5dda2efdSMircea Trofin  big_o.iterations = 0;
5dda2efdSMircea Trofin  big_o.real_accumulated_time = result_real.coef;
5dda2efdSMircea Trofin  big_o.cpu_accumulated_time = result_cpu.coef;
5dda2efdSMircea Trofin  big_o.report_big_o = true;
5dda2efdSMircea Trofin  big_o.complexity = result_cpu.complexity;
5dda2efdSMircea Trofin
5dda2efdSMircea Trofin  // All the time results are reported after being multiplied by the
5dda2efdSMircea Trofin  // time unit multiplier. But since RMS is a relative quantity it
5dda2efdSMircea Trofin  // should not be multiplied at all. So, here, we _divide_ it by the
5dda2efdSMircea Trofin  // multiplier so that when it is multiplied later the result is the
5dda2efdSMircea Trofin  // correct one.
5dda2efdSMircea Trofin  double multiplier = GetTimeUnitMultiplier(reports[0].time_unit);
5dda2efdSMircea Trofin
5dda2efdSMircea Trofin  // Only add label to mean/stddev if it is same for all runs
5dda2efdSMircea Trofin  Run rms;
5dda2efdSMircea Trofin  rms.run_name = run_name;
5dda2efdSMircea Trofin  rms.family_index = reports[0].family_index;
5dda2efdSMircea Trofin  rms.per_family_instance_index = reports[0].per_family_instance_index;
5dda2efdSMircea Trofin  rms.run_type = BenchmarkReporter::Run::RT_Aggregate;
5dda2efdSMircea Trofin  rms.aggregate_name = "RMS";
a290770fSMircea Trofin  rms.aggregate_unit = StatisticUnit::kPercentage;
5dda2efdSMircea Trofin  rms.report_label = big_o.report_label;
5dda2efdSMircea Trofin  rms.iterations = 0;
5dda2efdSMircea Trofin  rms.repetition_index = Run::no_repetition_index;
5dda2efdSMircea Trofin  rms.repetitions = reports[0].repetitions;
5dda2efdSMircea Trofin  rms.threads = reports[0].threads;
5dda2efdSMircea Trofin  rms.real_accumulated_time = result_real.rms / multiplier;
5dda2efdSMircea Trofin  rms.cpu_accumulated_time = result_cpu.rms / multiplier;
5dda2efdSMircea Trofin  rms.report_rms = true;
5dda2efdSMircea Trofin  rms.complexity = result_cpu.complexity;
5dda2efdSMircea Trofin  // don't forget to keep the time unit, or we won't be able to
5dda2efdSMircea Trofin  // recover the correct value.
5dda2efdSMircea Trofin  rms.time_unit = reports[0].time_unit;
5dda2efdSMircea Trofin
5dda2efdSMircea Trofin  results.push_back(big_o);
5dda2efdSMircea Trofin  results.push_back(rms);
5dda2efdSMircea Trofin  return results;
5dda2efdSMircea Trofin}
5dda2efdSMircea Trofin
5dda2efdSMircea Trofin}  // end namespace benchmark