compareNA <- function(v1, v2) {
  same <- (v1 == v2) | (is.na(v1) & is.na(v2))
  same[is.na(same)] <- FALSE
  return(same)
}

test_that("mgus example: no Competing risk", {
  cdm <- mockMGUS2cdm()
  surv <- estimateSingleEventSurvival(cdm,
    targetCohortTable = "mgus_diagnosis",
    targetCohortId = 1,
    outcomeCohortTable = "death_cohort",
    outcomeCohortId = 1,
    timeGap = 7
  )
  expect_true(tibble::is_tibble(surv))
  expect_true(all(c(
    "cdm_name","result_type",
    "group_name","group_level",
    "strata_name","strata_level",
    "variable","variable_level",
    "estimate_type",
    "variable_type",
    "time",
    "analysis_type",
    "estimate") %in%
      colnames(surv)))

  expect_true(attr(surv, "events") %>% dplyr::select(variable) %>% dplyr::pull() %>% unique() == "Outcome")
  expect_true(all(compareNA(surv %>% dplyr::select(time) %>% dplyr::pull() %>% unique(),
                            c(0:max(surv$time)))))
  expect_true(surv %>% dplyr::select(analysis_type) %>% dplyr::pull() %>% unique() == "Single event")

  expect_true(attr(surv, "events") %>%
                dplyr::select(variable_level) %>% dplyr::pull() %>% unique() == "timeGap 7")
  expect_true(all(surv %>% dplyr::filter(estimate_type == "Survival events") %>%
                    dplyr::select(time) %>% dplyr::pull() %>% unique() == c(seq(0, 424, by = 7), 424)))

  expect_true(tibble::is_tibble(attr(surv, "summary")))

  expect_true(all(surv$variable_level == "death_cohort"))
  expect_true(all(attr(surv, "event")$outcome == "death_cohort"))
  expect_true(all(attr(surv, "summary")$variable_level == "death_cohort"))



  # mgus example: Competing risk
  survCR <- estimateSurvival(cdm,
    targetCohortTable = "mgus_diagnosis",
    targetCohortId = 1,
    outcomeCohortTable = "progression",
    outcomeCohortId = 1,
    competingOutcomeCohortTable = "death_cohort",
    competingOutcomeCohortId = 1
  )

  expect_true(all(colnames(surv) == colnames(survCR)))

  expect_true(tibble::is_tibble(survCR))

  # note, we don't return summary for competing risk

  expect_true(all(survCR %>%
                    dplyr::select(outcome) %>%
                    dplyr::pull() %>%
                    unique() %in%
                    c("death_cohort", "progression", "outcome", "competing outcome", "none")))

  expect_true(all(compareNA(survCR %>%
                    dplyr::select(time) %>%
                    dplyr::pull() %>%
                    unique(), c(0:424))))

  expect_true(survCR %>%
                dplyr::select(analysis_type) %>%
                dplyr::pull() %>%
                unique() == "Competing risk")

  expect_true(all(survCR %>% dplyr::filter(estimate_type == "Survival events") %>%
                    dplyr::select(variable_level) %>%
                    dplyr::pull() %>%
                    unique() %in% c("timeGap 1", "timeGap 7", "timeGap 30", "timeGap 365")))

  expect_true(all(survCR %>% dplyr::filter(estimate_type == "Survival events") %>%
                    dplyr::select(time) %>%
                    dplyr::pull() %>% unique() == c(0:424)))

  expect_true(nrow(survCR %>%
    dplyr::filter(.data$outcome == "death_cohort") %>%
    dplyr::collect())>=1)
  expect_true(nrow(survCR %>%
                     dplyr::filter(.data$outcome == "progression") %>%
                     dplyr::collect())>=1)

  expect_true(all(c("death_cohort", "progression") %in%
                (survCR %>%
                dplyr::pull("variable_level") %>%
                unique())))

  CDMConnector::cdmDisconnect(cdm)
})

test_that("mgus example: no Competing risk, strata", {
  cdm <- mockMGUS2cdm()
  cdm[["mgus_diagnosis"]] <- cdm[["mgus_diagnosis"]] %>%
    dplyr::mutate(mspike_r = round(mspike, digits = 0))
  surv <- estimateSingleEventSurvival(cdm,
    targetCohortTable = "mgus_diagnosis",
    targetCohortId = 1,
    outcomeCohortTable = "death_cohort",
    outcomeCohortId = 1,
    timeGap = c(1, 10, 100),
    strata = list(
      "age_gr" = c("age"),
      "sex" = c("sex"),
      "age and sex" = c("age", "sex"),
      "mspike rounded" = c("mspike_r")
    )
  )
  expect_true(tibble::is_tibble(surv))

  expect_true(all(surv %>% dplyr::select(outcome) %>% dplyr::pull() %>% unique() %in% c("death_cohort", "outcome")))
  expect_true(all(compareNA(surv %>% dplyr::select(time) %>% dplyr::pull() %>% unique(), c(0:424))))
  expect_true(surv %>% dplyr::select(analysis_type) %>% dplyr::pull() %>% unique() == "Single event")
  expect_true(all(surv %>% dplyr::select(strata_name) %>% dplyr::pull() %>% unique() %in%
                    c("Overall", "sex", "age", "mspike_r", "age and sex")))
  expect_true(all(surv %>% dplyr::select(strata_level) %>% dplyr::pull() %>% unique() %in% c(
    "M", "F", 0, 1, 2, 3, c(24:96), "Overall",
    paste(expand.grid(c(24:96), c("M", "F"))$Var1, expand.grid(c(24:96), c("M", "F"))$Var2, sep = " and ")
  )))

  expect_true(all(surv %>% dplyr::filter(estimate_type == "Survival events") %>%
                    dplyr::select(variable_level) %>% dplyr::pull() %>% unique() %in% c("timeGap 1", "timeGap 10", "timeGap 100")))
  expect_true(all(surv %>% dplyr::filter(estimate_type == "Survival events") %>% dplyr::select(time) %>% dplyr::pull() %>% unique() == c(0:424)))
  expect_true(all(surv %>% dplyr::filter(estimate_type == "Survival events") %>% dplyr::select(strata_name) %>% dplyr::pull() %>% unique() %in%
                    c("Overall", "sex", "age", "mspike_r", "age and sex")))
  expect_true(all(surv %>% dplyr::filter(estimate_type == "Survival events") %>% dplyr::select(strata_level) %>% dplyr::pull() %>% unique() %in% c(
    "M", "F", 0, 1, 2, 3, c(24:96), "Overall",
    paste(expand.grid(c(24:96), c("M", "F"))$Var1, expand.grid(c(24:96), c("M", "F"))$Var2, sep = " and ")
  )))

  CDMConnector::cdmDisconnect(cdm)
})

test_that("mgus example: Competing risk, strata", {
  cdm <- mockMGUS2cdm()
  cdm[["mgus_diagnosis"]] <- cdm[["mgus_diagnosis"]] %>%
    dplyr::mutate(mspike_r = round(mspike, digits = 0))
  survCR <- estimateSurvival(cdm,
                             targetCohortTable = "mgus_diagnosis",
                             targetCohortId = 1,
                             outcomeCohortTable = "progression",
                             outcomeCohortId = 1,
                             competingOutcomeCohortTable = "death_cohort",
                             competingOutcomeCohortId = 1,
                             strata = list(
                               "age" = c("age"),
                               "sex" = c("sex"),
                               "age and sex" = c("age", "sex"),
                               "mspike rounded" = c("mspike_r")
                             )
  )

  expect_true(tibble::is_tibble(survCR))
  expect_true(all(survCR %>% dplyr::select(outcome) %>% dplyr::pull() %>% unique() %in%
                    c("death_cohort", "progression", "outcome", "competing outcome","none")))
  expect_true(all(compareNA(survCR %>% dplyr::select(time) %>% dplyr::pull() %>% unique(), c(0:424))))
  expect_true(survCR %>% dplyr::select(analysis_type) %>% dplyr::pull() %>% unique() == "Competing risk")
  expect_true(all(survCR %>% dplyr::select(strata_name) %>% dplyr::pull() %>% unique() %in% c("Overall", "sex", "age", "mspike_r", "age and sex")))
  expect_true(all(survCR %>% dplyr::select(strata_level) %>% dplyr::pull() %>% unique() %in% c(
    "M", "F", 0, 1, 2, 3, c(24:96), "Overall",
    paste(expand.grid(c(24:96), c("M", "F"))$Var1, expand.grid(c(24:96), c("M", "F"))$Var2, sep = " and ")
  )))

  expect_true(all(survCR %>% dplyr::filter(estimate_type == "Survival events") %>% dplyr::select(variable_level) %>% dplyr::pull() %>% unique() %in% c("timeGap 1", "timeGap 7", "timeGap 30", "timeGap 365")))
  expect_true(all(survCR %>% dplyr::filter(estimate_type == "Survival events") %>% dplyr::select(time) %>% dplyr::pull() %>% unique() == c(0:424)))
  expect_true(all(survCR %>% dplyr::filter(estimate_type == "Survival events") %>% dplyr::select(strata_name) %>% dplyr::pull() %>% unique() %in% c("Overall", "sex", "age", "mspike_r", "age and sex")))
  expect_true(all(survCR %>% dplyr::filter(estimate_type == "Survival events") %>% dplyr::select(strata_level) %>% dplyr::pull() %>% unique() %in% c(
    "M", "F", 0, 1, 2, 3, c(24:96), "Overall",
    paste(expand.grid(c(24:96), c("M", "F"))$Var1, expand.grid(c(24:96), c("M", "F"))$Var2, sep = " and ")
  )))


  # strata with only one value
  cdm$mgus_diagnosis <- cdm$mgus_diagnosis %>% dplyr::mutate(a = "X")
  survCR <- estimateSurvival(cdm,
                             targetCohortTable = "mgus_diagnosis",
                             targetCohortId = 1,
                             outcomeCohortTable = "progression",
                             outcomeCohortId = 1,
                             competingOutcomeCohortTable = "death_cohort",
                             competingOutcomeCohortId = 1,
                             strata = list("a" = "a"))

  CDMConnector::cdmDisconnect(cdm)
})

test_that("multiple exposures, multiple outcomes: single event", {

  observation_period <- dplyr::tibble(
    observation_period_id = c(1, 2, 3, 4, 5),
    person_id = c(1, 2, 3, 4, 5),
    observation_period_start_date = c(
      rep(as.Date("1980-07-20"),5)
    ),
    observation_period_end_date = c(
     rep(as.Date("2023-05-20"),5)
    )
  )

  exposure_cohort <- dplyr::tibble(
    subject_id = c(1, 2, 3, 3, 4, 5),
    cohort_definition_id = c(1, 1, 1, 2, 2, 2),
    cohort_start_date = c(
      as.Date("2020-01-01"),
      as.Date("2020-02-03"),
      as.Date("2020-05-01"),
      as.Date("2020-05-01"),
      as.Date("2020-08-01"),
      as.Date("2020-09-01")
    ),
    cohort_end_date = c(
      as.Date("2020-01-31"),
      as.Date("2022-02-03"),
      as.Date("2021-06-28"),
      as.Date("2021-06-01"),
      as.Date("2021-08-01"),
      as.Date("2021-09-01")
    )
  )


  outcome_cohort <- dplyr::tibble(
    cohort_definition_id = c(2, 3, 3),
    subject_id = c(2, 3, 4),
    cohort_start_date = c(
      as.Date("2021-01-01"),
      as.Date("2021-01-01"),
      as.Date("2021-01-01")
    ),
    cohort_end_date = c(
      as.Date("2021-01-01"),
      as.Date("2021-01-01"),
      as.Date("2021-01-01")
    )
  )

  cdm <- PatientProfiles::mockPatientProfiles(
    exposure_cohort = exposure_cohort,
    cohort1 = outcome_cohort,
    observation_period = observation_period
  )

  # one target, one outcome
  expect_no_error(surv <- estimateSingleEventSurvival(cdm,
                                      targetCohortTable = "exposure_cohort",
                                      targetCohortId = 1,
                                      outcomeCohortTable = "cohort1",
                                      outcomeCohortId = 2
  ))
  expect_equal(unique(surv$group_level),
              CDMConnector::cohort_set(cdm$exposure_cohort) %>%
                dplyr::filter(cohort_definition_id == 1) %>%
                dplyr::pull("cohort_name"))
  expect_equal(unique(surv$variable_level),
               CDMConnector::cohort_set(cdm$cohort1) %>%
                 dplyr::filter(cohort_definition_id == 2) %>%
                 dplyr::pull("cohort_name"))

  # two target, one outcome
  surv <- estimateSingleEventSurvival(cdm,
                                      targetCohortTable = "exposure_cohort",
                                      targetCohortId = c(1,2),
                                      outcomeCohortTable = "cohort1",
                                      outcomeCohortId = 2
  )
  expect_equal(sort(unique(surv$group_level)),
               sort(CDMConnector::cohort_set(cdm$exposure_cohort) %>%
                 dplyr::filter(cohort_definition_id %in%  c(1,2)) %>%
                 dplyr::pull("cohort_name")))
  expect_equal(unique(surv$variable_level),
               CDMConnector::cohort_set(cdm$cohort1) %>%
                 dplyr::filter(cohort_definition_id == 2) %>%
                 dplyr::pull("cohort_name"))

  # two target, two outcome
  surv <- estimateSingleEventSurvival(cdm,
                                      targetCohortTable = "exposure_cohort",
                                      targetCohortId = c(1,2),
                                      outcomeCohortTable = "cohort1",
                                      outcomeCohortId = c(2,3),
                                      minCellCount = 0
  )
  expect_equal(sort(unique(surv$group_level)),
               sort(CDMConnector::cohort_set(cdm$exposure_cohort) %>%
                      dplyr::filter(cohort_definition_id %in%  c(1,2)) %>%
                      dplyr::pull("cohort_name")))
  expect_equal(unique(surv$variable_level),
               CDMConnector::cohort_set(cdm$cohort1) %>%
                 dplyr::filter(cohort_definition_id %in%  c(2,3)) %>%
                 dplyr::pull("cohort_name"))

  expect_equal(sort(unique(attr(surv, "event")$group_level)),
               sort(CDMConnector::cohort_set(cdm$exposure_cohort) %>%
                      dplyr::filter(cohort_definition_id %in%  c(1,2)) %>%
                      dplyr::pull("cohort_name")))
  expect_equal(unique(attr(surv, "event")$outcome),
               CDMConnector::cohort_set(cdm$cohort1) %>%
                 dplyr::filter(cohort_definition_id %in%  c(2,3)) %>%
                 dplyr::pull("cohort_name"))

  expect_equal(sort(unique(attr(surv, "summary")$group_level)),
               sort(CDMConnector::cohort_set(cdm$exposure_cohort) %>%
                      dplyr::filter(cohort_definition_id %in%  c(1,2)) %>%
                      dplyr::pull("cohort_name")))
  expect_equal(unique(attr(surv, "summary")$variable_level),
               CDMConnector::cohort_set(cdm$cohort1) %>%
                 dplyr::filter(cohort_definition_id %in%  c(2,3)) %>%
                 dplyr::pull("cohort_name"))

  # two target, two outcome - without specifying
  surv <- estimateSingleEventSurvival(cdm,
                                      targetCohortTable = "exposure_cohort",
                                      outcomeCohortTable = "cohort1"
  )
  expect_equal(sort(unique(surv$group_level)),
               sort(CDMConnector::cohort_set(cdm$exposure_cohort) %>%
                      dplyr::filter(cohort_definition_id %in%  c(1,2)) %>%
                      dplyr::pull("cohort_name")))
  expect_equal(unique(surv$variable_level),
               CDMConnector::cohort_set(cdm$cohort1) %>%
                 dplyr::filter(cohort_definition_id %in%  c(2,3)) %>%
                 dplyr::pull("cohort_name"))


  CDMConnector::cdmDisconnect(cdm)

  })

test_that("multiple exposures, multiple outcomes: competing risk", {

  observation_period <- dplyr::tibble(
    observation_period_id = c(1, 2, 3, 4, 5,6),
    person_id = c(1, 2, 3, 4, 5,6),
    observation_period_start_date = c(
      rep(as.Date("1980-07-20"),6)
    ),
    observation_period_end_date = c(
      rep(as.Date("2023-05-20"),6)
    )
  )

  exposure_cohort <- dplyr::tibble(
    subject_id = c(1, 2, 3, 3, 4, 5,6,6),
    cohort_definition_id = c(1, 1, 1, 2, 2, 2,1,2),
    cohort_start_date = c(
      as.Date("2020-01-01"),
      as.Date("2020-02-03"),
      as.Date("2020-05-01"),
      as.Date("2020-05-01"),
      as.Date("2020-08-01"),
      as.Date("2020-09-01"),
      as.Date("2020-09-01"),
      as.Date("2020-09-01")
    ),
    cohort_end_date = c(
      as.Date("2020-01-31"),
      as.Date("2022-02-03"),
      as.Date("2021-06-28"),
      as.Date("2021-06-01"),
      as.Date("2021-08-01"),
      as.Date("2021-09-01"),
      as.Date("2021-09-01"),
      as.Date("2021-09-01")
    )
  )

  outcome_cohort <- dplyr::tibble(
    cohort_definition_id = c(2,2, 3, 3),
    subject_id = c(2, 3, 3, 4),
    cohort_start_date = c(
      as.Date("2021-01-01"),
      as.Date("2021-01-01"),
      as.Date("2021-01-01"),
      as.Date("2021-01-01")
    ),
    cohort_end_date = c(
      as.Date("2021-01-01"),
      as.Date("2021-01-01"),
      as.Date("2021-01-01"),
      as.Date("2021-01-01")
    )
  )

  competing_cohort <- dplyr::tibble(
    cohort_definition_id = c(4,5, 4, 5),
    subject_id = c(1,1, 5, 5),
    cohort_start_date = c(
      as.Date("2020-11-01"),
      as.Date("2020-11-01"),
      as.Date("2020-11-01"),
      as.Date("2020-11-01")
    ),
    cohort_end_date = c(
      as.Date("2020-11-01"),
      as.Date("2020-11-01"),
      as.Date("2020-11-01"),
      as.Date("2020-11-01")
    )
  )

  cdm <- PatientProfiles::mockPatientProfiles(
    exposure_cohort = exposure_cohort,
    cohort1 = outcome_cohort,
    observation_period = observation_period,
    cohort2 = competing_cohort
  )

  # one target, one outcome
  expect_no_error(surv <- estimateCompetingRiskSurvival(cdm,
                                                      targetCohortTable = "exposure_cohort",
                                                      targetCohortId = 1,
                                                      outcomeCohortTable = "cohort1",
                                                      outcomeCohortId = 2,
                                                      competingOutcomeCohortTable  = "cohort2",
                                                      competingOutcomeCohortId = 4
  ))
  expect_equal(unique(surv$group_level),
               CDMConnector::cohort_set(cdm$exposure_cohort) %>%
                 dplyr::filter(cohort_definition_id == 1) %>%
                 dplyr::pull("cohort_name"))
  expect_equal(sort(unique(surv$variable_level)),
               sort(c(CDMConnector::cohort_set(cdm$cohort1) %>%
                 dplyr::filter(cohort_definition_id == 2) %>%
                 dplyr::pull("cohort_name"),
                 CDMConnector::cohort_set(cdm$cohort2) %>%
                   dplyr::filter(cohort_definition_id == 4) %>%
                   dplyr::pull("cohort_name"))))

  # two target, one outcome, one competing risk
  expect_no_error(surv <- estimateCompetingRiskSurvival(cdm,
                                      targetCohortTable = "exposure_cohort",
                                      targetCohortId = c(1,2),
                                      outcomeCohortTable = "cohort1",
                                      outcomeCohortId = 2,
                                      competingOutcomeCohortTable  = "cohort2",
                                      competingOutcomeCohortId = 4
  ))
  expect_equal(sort(unique(surv$group_level)),
               sort(CDMConnector::cohort_set(cdm$exposure_cohort) %>%
                      dplyr::filter(cohort_definition_id %in%  c(1,2)) %>%
                      dplyr::pull("cohort_name")))
  expect_equal(sort(unique(surv$variable_level)),
               sort(c(CDMConnector::cohort_set(cdm$cohort1) %>%
                        dplyr::filter(cohort_definition_id == 2) %>%
                        dplyr::pull("cohort_name"),
                      CDMConnector::cohort_set(cdm$cohort2) %>%
                        dplyr::filter(cohort_definition_id == 4) %>%
                        dplyr::pull("cohort_name"))))

  # two target, two outcome, one competing risk
  surv <- estimateCompetingRiskSurvival(cdm,
                                      targetCohortTable = "exposure_cohort",
                                      targetCohortId = c(1,2),
                                      outcomeCohortTable = "cohort1",
                                      outcomeCohortId = c(2,3),
                                      competingOutcomeCohortTable  = "cohort2",
                                      competingOutcomeCohortId = 4
  )
  expect_equal(sort(unique(surv$group_level)),
               sort(CDMConnector::cohort_set(cdm$exposure_cohort) %>%
                      dplyr::filter(cohort_definition_id %in%  c(1,2)) %>%
                      dplyr::pull("cohort_name")))
  expect_equal(sort(unique(surv$variable_level)),
               sort(c(CDMConnector::cohort_set(cdm$cohort1) %>%
                        dplyr::filter(cohort_definition_id %in%  c(2,3)) %>%
                        dplyr::pull("cohort_name"),
                      CDMConnector::cohort_set(cdm$cohort2) %>%
                        dplyr::filter(cohort_definition_id == 4) %>%
                        dplyr::pull("cohort_name"))))

  # two target, two outcome, two competing risk
  surv <- estimateCompetingRiskSurvival(cdm,
                                      targetCohortTable = "exposure_cohort",
                                      targetCohortId = c(1,2),
                                      outcomeCohortTable = "cohort1",
                                      outcomeCohortId = c(2,3),
                                      competingOutcomeCohortTable  = "cohort2",
                                      competingOutcomeCohortId = c(4,5)
  )
  expect_equal(sort(unique(surv$group_level)),
               sort(CDMConnector::cohort_set(cdm$exposure_cohort) %>%
                      dplyr::filter(cohort_definition_id %in%  c(1,2)) %>%
                      dplyr::pull("cohort_name")))
  expect_equal(sort(unique(surv$variable_level)),
               sort(c(CDMConnector::cohort_set(cdm$cohort1) %>%
                        dplyr::filter(cohort_definition_id %in%  c(2,3)) %>%
                        dplyr::pull("cohort_name"),
                      CDMConnector::cohort_set(cdm$cohort2) %>%
                        dplyr::filter(cohort_definition_id %in% c(4,5)) %>%
                        dplyr::pull("cohort_name"))))

  #  two target, two outcome, two competing risk - without specifying
  surv <- estimateCompetingRiskSurvival(cdm,
                                      targetCohortTable = "exposure_cohort",
                                      outcomeCohortTable = "cohort1",
                                      competingOutcomeCohortTable  = "cohort2"
  )
  expect_equal(sort(unique(surv$group_level)),
               sort(CDMConnector::cohort_set(cdm$exposure_cohort) %>%
                      dplyr::filter(cohort_definition_id %in%  c(1,2)) %>%
                      dplyr::pull("cohort_name")))
  expect_equal(sort(unique(surv$variable_level)),
               sort(c(CDMConnector::cohort_set(cdm$cohort1) %>%
                        dplyr::filter(cohort_definition_id %in%  c(2,3)) %>%
                        dplyr::pull("cohort_name"),
                      CDMConnector::cohort_set(cdm$cohort2) %>%
                        dplyr::filter(cohort_definition_id %in% c(4,5)) %>%
                        dplyr::pull("cohort_name"))))

  CDMConnector::cdmDisconnect(cdm)

})

test_that("funcionality with created dataset", {
  exposure_cohort <- dplyr::tibble(
    subject_id = c(1, 2, 3),
    cohort_definition_id = c(1, 1, 1),
    cohort_start_date = c(
      as.Date("2020-01-01"),
      as.Date("2020-02-03"),
      as.Date("2020-05-01")
    ),
    cohort_end_date = c(
      as.Date("2020-01-31"),
      as.Date("2022-02-03"),
      as.Date("2021-06-28")
    ),
    age_group = c("20;29", "20;29", "60;69"),
    sex = c("Female", "Male", "Female"),
    blood_type = c("A", "B", "B")
  )
  outcome_cohort <- dplyr::tibble(
    cohort_definition_id = c(1, 1, 1, 1, 1),
    subject_id = c(1, 1, 2, 3, 3),
    cohort_start_date = c(
      as.Date("2020-01-10"),
      as.Date("2020-02-02"),
      as.Date("2020-02-09"),
      as.Date("2020-06-01"),
      as.Date("2020-06-03")
    ),
    cohort_end_date = c(
      as.Date("2020-01-10"),
      as.Date("2020-02-02"),
      as.Date("2020-02-09"),
      as.Date("2020-06-01"),
      as.Date("2020-06-03")
    )
  )
  observation_period <- dplyr::tibble(
    observation_period_id = c(1, 1, 1),
    person_id = c(1, 2, 3),
    observation_period_start_date = c(
      as.Date("2007-03-21"),
      as.Date("2006-09-09"),
      as.Date("1980-07-20")
    ),
    observation_period_end_date = c(
      as.Date("2022-09-08"),
      as.Date("2023-01-03"),
      as.Date("2023-05-20")
    )
  )

  cdm <- PatientProfiles::mockPatientProfiles(
    exposure_cohort = exposure_cohort,
    cohort1 = outcome_cohort,
    observation_period = observation_period
  )

  # No competing events
  surv <- estimateSingleEventSurvival(cdm,
    targetCohortTable = "exposure_cohort",
    outcomeCohortTable = "cohort1",
    minCellCount = 1
  )

  expect_true(all(compareNA(surv %>% dplyr::select(time) %>% dplyr::pull() %>%
                    unique(), c(0:31))))
  expect_true(all(surv %>%
                    dplyr::filter(variable_type == "n_risk") %>%
                    dplyr::select(estimate) %>%
                    dplyr::pull() ==
                    c(rep(3, 7), rep(2, 3), rep(1, 22))))
  expect_true(all(surv %>%
                    dplyr::filter(variable_type == "estimate")  %>%
    dplyr::filter(estimate_type == "Survival probability") %>%
      dplyr::select(estimate) %>%
    dplyr::pull() - c(rep(1, 7), rep(0.667, 3), rep(0.333, 21), 0) < c(0.01)))
  expect_true(all(surv %>%
                    dplyr::filter(variable_type == "estimate")  %>%
                    dplyr::filter(estimate_type == "Cumulative failure probability") %>%
                    dplyr::select(estimate) %>% dplyr::pull() - c(rep(0, 6), rep(0.333, 3), rep(0.667, 22), 1) < c(0.01)))
  expect_true(all(surv %>% dplyr::select(analysis_type) %>% dplyr::pull() == "Single event"))

  expect_true(all(attr(surv, "events") %>% dplyr::select(variable_level) %>% dplyr::pull() %in% c("timeGap 1", "timeGap 7", "timeGap 30", "timeGap 365")))
  expect_true(all(attr(surv, "events") %>%
                    dplyr::filter(time==0,
                                  variable_type== "n_risk") %>%
                    dplyr::pull("estimate") %in%  c(3)))

  CDMConnector::cdmDisconnect(cdm)

  # Competing events
  outcome_cohort <- dplyr::tibble(
    cohort_definition_id = c(1, 1, 1),
    subject_id = c(2, 3, 3),
    cohort_start_date = c(
      as.Date("2020-02-09"),
      as.Date("2020-06-01"),
      as.Date("2020-06-03")
    ),
    cohort_end_date = c(
      as.Date("2020-02-09"),
      as.Date("2020-06-01"),
      as.Date("2020-06-03")
    )
  )
  competing_risk_cohort <- dplyr::tibble(
    cohort_definition_id = c(1, 1, 2),
    subject_id = c(2, 3, 1),
    cohort_start_date = c(
      as.Date("2020-02-07"),
      as.Date("2021-02-02"),
      as.Date("2020-01-03")
    ),
    cohort_end_date = c(
      as.Date("2020-02-07"),
      as.Date("2021-02-02"),
      as.Date("2020-01-03")
    )
  )
  cdm <- PatientProfiles::mockPatientProfiles(
    exposure_cohort = exposure_cohort,
    cohort1 = outcome_cohort,
    cohort2 = competing_risk_cohort,
    observation_period = observation_period
  )
  surv2 <- estimateCompetingRiskSurvival(cdm,
    targetCohortTable = "exposure_cohort",
    outcomeCohortTable = "cohort1",
    competingOutcomeCohortTable = "cohort2",
    competingOutcomeCohortId = 1,
    minCellCount = 1
  )

  expect_true(all(compareNA(surv2 %>% dplyr::select(time) %>% dplyr::pull() %>% unique(), c(0:981))))
  expect_true(all(surv2 %>%
                    dplyr::filter(outcome == "outcome") %>%
                    dplyr::filter(estimate_type == "Cumulative failure probability") %>%
                    dplyr::filter(variable_type == "n_risk") %>%
                    dplyr::select(estimate) %>%
                    dplyr::pull() ==
                    c(rep(3, 5), rep(2, 27), rep(1, 950))))
  expect_true(nrow(surv2 %>%
                          dplyr::filter(estimate_type == "Survival probability") %>%
                          dplyr::select(estimate)) == 0)
  expect_true(all(surv2 %>% dplyr::filter(variable_type == "n_risk") %>% dplyr::pull() ==
                    c(rep(3, 5), rep(2, 27), rep(1, 950))))

  expect_true(all(surv2 %>% dplyr::select(analysis_type) %>% dplyr::pull() == "Competing risk"))
  expect_true(all(surv2 %>% dplyr::select(outcome) %>% dplyr::pull() %in% c("cohort_1", "cohort_1_competing_outcome", "outcome", "competing outcome", "none")))
  expect_true(all(attr(surv2, "events") %>%
                    dplyr::filter(variable_level == "timeGap 30") %>%
                    dplyr::pull("time") %in%  c(seq(0,981, by = 30), 981)))
  expect_true(all(attr(surv2, "events") %>%
                    dplyr::filter(variable_level == "timeGap 365") %>%
                    dplyr::pull("time") %in%  c(seq(0,981, by = 365), 981)))

  CDMConnector::cdmDisconnect(cdm)

  # Censor at cohort end
  outcome_cohort <- dplyr::tibble(
    cohort_definition_id = c(1, 1, 1, 1, 1),
    subject_id = c(1, 1, 2, 3, 3),
    cohort_start_date = c(
      as.Date("2020-02-10"),
      as.Date("2020-02-02"),
      as.Date("2020-02-09"),
      as.Date("2020-06-01"),
      as.Date("2020-06-03")
    ),
    cohort_end_date = c(
      as.Date("2020-02-10"),
      as.Date("2020-02-02"),
      as.Date("2020-02-09"),
      as.Date("2020-06-01"),
      as.Date("2020-06-03")
    )
  )

  cdm <- PatientProfiles::mockPatientProfiles(
    exposure_cohort = exposure_cohort,
    cohort1 = outcome_cohort,
    observation_period = observation_period
  )

  surv3 <- estimateSingleEventSurvival(cdm, "exposure_cohort",
    outcomeCohortTable = "cohort1",
    censorOnCohortExit = TRUE,
    minCellCount = 1
  )

  expect_true(all(compareNA(surv3 %>% dplyr::select(time) %>% dplyr::pull() %>% unique(), c(0:31))))
   expect_true(all(surv3 %>% dplyr::filter(variable_type == "n_risk") %>%
                     dplyr::select(estimate) %>% dplyr::pull() == c(rep(3, 7), rep(2, 24), 1)))
   expect_true(all(surv3  %>%
                     dplyr::filter(estimate_type == "Cumulative failure probability") %>%
                     dplyr::filter(variable_type == "estimate") %>%
                     dplyr::select(estimate) %>% dplyr::pull() - c(rep(0, 6), rep(0.333, 25), 1) < c(0.01)))
   expect_true(all(surv3 %>% dplyr::select(analysis_type) %>% dplyr::pull() == "Single event"))

  CDMConnector::cdmDisconnect(cdm)

  cdm <- PatientProfiles::mockPatientProfiles(
    exposure_cohort = exposure_cohort,
    cohort1 = outcome_cohort,
    observation_period = observation_period
  )

  # Censor by follow up days
  surv4 <- estimateSingleEventSurvival(cdm, "exposure_cohort",
    outcomeCohortTable = "cohort1",
    followUpDays = 10,
    minCellCount = 1
  )

   expect_true(all(compareNA(surv4 %>% dplyr::select(time) %>% dplyr::pull() %>% unique(), c(0:10))))
   expect_true(all(surv4 %>% dplyr::filter(variable_type == "n_risk") %>% dplyr::select(estimate) %>% dplyr::pull() == c(rep(3, 7), rep(2, 4))))
   expect_true(all(surv4 %>%
                     dplyr::filter(estimate_type == "Cumulative failure probability") %>%
                     dplyr::filter(variable_type == "estimate") %>%
                     dplyr::select(estimate) %>% dplyr::pull() - c(rep(0, 6), rep(0.333, 5)) < c(0.01)))
   expect_true(all(surv4 %>% dplyr::select(analysis_type) %>% dplyr::pull() == "Single event"))

   expect_true(all(attr(surv4, "events") %>%
                     dplyr::filter(variable_level == "timeGap 1") %>%
                     dplyr::pull("time") %in%  c(0:10)))
  CDMConnector::cdmDisconnect(cdm)

  outcome_cohort <- dplyr::tibble(
    cohort_definition_id = c(1, 1, 1, 1, 1),
    subject_id = c(1, 1, 2, 3, 3),
    cohort_start_date = c(
      as.Date("2020-01-10"),
      as.Date("2020-02-02"),
      as.Date("2020-02-09"),
      as.Date("2020-06-01"),
      as.Date("2020-06-03")
    ),
    cohort_end_date = c(
      as.Date("2020-01-10"),
      as.Date("2020-02-02"),
      as.Date("2020-02-09"),
      as.Date("2020-06-01"),
      as.Date("2020-06-03")
    )
  )

  cdm <- PatientProfiles::mockPatientProfiles(
    exposure_cohort = exposure_cohort,
    cohort1 = outcome_cohort,
    observation_period = observation_period
  )

  # Strata
  surv5 <- estimateSingleEventSurvival(cdm, "exposure_cohort",
    outcomeCohortTable = "cohort1",
    strata = list(
      "Age group" = c("age_group"),
      "Sex" = c("sex"),
      "Age group and sex" = c("age_group", "sex"),
      "Blood type" = c("blood_type")
    ),
    minCellCount = 1
  )

  expect_true(all(compareNA(surv5 %>% dplyr::filter(strata_name == "Overall") %>% dplyr::select(time) %>% dplyr::pull() %>% unique(), c(0:31))))
   expect_true(all(surv5 %>% dplyr::filter(strata_name == "Overall") %>% dplyr::filter(estimate == "n_risk") %>% dplyr::select(estimate) %>% dplyr::pull() == c(rep(3, 7), rep(2, 3), rep(1, 22))))
   expect_true(all(surv5 %>% dplyr::filter(strata_name == "Overall") %>%
                     dplyr::filter(estimate_type == "Cumulative failure probability") %>%
                     dplyr::filter(variable_type == "estimate") %>%
                     dplyr::select(estimate) %>% dplyr::pull() - c(rep(0, 6), rep(0.333, 3), rep(0.667, 22), 1) < c(0.01)))
   expect_true(all(surv5 %>% dplyr::filter(strata_name == "Overall") %>% dplyr::select(analysis_type) %>% dplyr::pull() == "Single event"))

   expect_true(all(surv5 %>% dplyr::filter(strata_name == "age_group; sex" &
                                             strata_level == "20;29; Female") %>%
                     dplyr::select(time) %>% dplyr::pull() == c(0:31)))
   expect_true(all(compareNA(surv5 %>% dplyr::filter(strata_name == "age_group; sex" &
                                                       strata_level == "20;29; Female") %>%
                               dplyr::filter(estimate == "n_risk") %>% dplyr::select(estimate) %>%
                               dplyr::pull(), c(rep(c(rep(1, 10), rep(NA, 22)),2)))))
   expect_true(all(surv5 %>% dplyr::filter(strata_name == "age_group; sex" & strata_level == "20;29; Female") %>%
                     dplyr::filter(estimate_type == "Cumulative failure probability") %>%
                     dplyr::filter(variable_type == "estimate") %>%
                     dplyr::select(estimate) %>% dplyr::pull() - c(rep(0, 9), rep(1, 23)) < c(0.01)))
   expect_true(all(surv5 %>% dplyr::filter(strata_name == "age_group; sex" & strata_level == "20;29; Female") %>% dplyr::select(analysis_type) %>% dplyr::pull() == "Single event"))

   expect_true(all(attr(surv5, "events") %>%
                     dplyr::filter(strata_name == "age_group and sex" &
                                     strata_level == "20;29 and Female") %>%
                     dplyr::filter(variable_level == "timeGap 1") %>%
                     dplyr::pull("time") %in%  c(0:31)))

   expect_true(all(surv5 %>% dplyr::filter(estimate_type == "Cumulative failure probability" & variable_type == "estimate" & strata_name == "blood_type" & strata_level == "B") %>% dplyr::select(time) %>% dplyr::pull() == c(0:31)))
   expect_true(all(surv5 %>% dplyr::filter(estimate_type == "Cumulative failure probability" & variable_type == "n_risk" & strata_name == "blood_type" & strata_level == "B") %>% dplyr::select(estimate) %>% dplyr::pull() == c(rep(2, 7), rep(1, 25))))
   expect_true(all(surv5 %>% dplyr::filter(estimate_type == "Cumulative failure probability" & variable_type == "estimate" & strata_name == "blood_type" & strata_level == "B") %>%
                     dplyr::select(estimate) %>% dplyr::pull() - c(rep(0, 6), rep(0.5, 25), 1) < c(0.01)))
   expect_true(all(surv5 %>% dplyr::filter(strata_name == "blood_type" & strata_level == "B") %>% dplyr::select(analysis_type) %>% dplyr::pull() == "Single event"))

  CDMConnector::cdmDisconnect(cdm)

  outcome_cohort <- dplyr::tibble(
    cohort_definition_id = c(1, 1, 1, 1),
    subject_id = c(1, 2, 3, 3),
    cohort_start_date = c(
      as.Date("2019-01-10"),
      as.Date("2020-02-09"),
      as.Date("2020-06-01"),
      as.Date("2020-06-03")
    ),
    cohort_end_date = c(
      as.Date("2019-01-10"),
      as.Date("2020-02-09"),
      as.Date("2020-06-01"),
      as.Date("2020-06-03")
    )
  )

  cdm <- PatientProfiles::mockPatientProfiles(
    exposure_cohort = exposure_cohort,
    cohort1 = outcome_cohort,
    observation_period = observation_period
  )

  # Washout for outcome
  surv6 <- estimateSingleEventSurvival(cdm,
    targetCohortTable = "exposure_cohort",
    outcomeCohortTable = "cohort1",
    minCellCount = 1
  )

   expect_true(all(compareNA(surv6 %>% dplyr::select(time) %>% dplyr::pull() %>% unique(), c(0:31))))
   expect_true(all(surv6 %>% dplyr::filter(estimate == "n_risk") %>% dplyr::select(estimate) %>% dplyr::pull() == c(rep(2, 7), rep(1, 25))))
   expect_true(all(surv6 %>%
                     dplyr::filter(estimate_type == "Cumulative failure probability") %>%
                     dplyr::filter(variable_type == "estimate") %>%
                     dplyr::select(estimate) %>% dplyr::pull() - c(rep(0, 6), rep(0.5, 25), 1) < c(0.01)))
   expect_true(all(surv6 %>% dplyr::select(analysis_type) %>% dplyr::pull() == "Single event"))

  CDMConnector::cdmDisconnect(cdm)

  outcome_cohort <- dplyr::tibble(
    cohort_definition_id = c(1, 1, 1, 1),
    subject_id = c(1, 2, 3, 3),
    cohort_start_date = c(
      as.Date("2020-01-10"),
      as.Date("2020-02-09"),
      as.Date("2020-06-01"),
      as.Date("2020-06-03")
    ),
    cohort_end_date = c(
      as.Date("2020-01-10"),
      as.Date("2020-02-09"),
      as.Date("2020-06-01"),
      as.Date("2020-06-03")
    )
  )

  cdm <- PatientProfiles::mockPatientProfiles(
    exposure_cohort = exposure_cohort,
    cohort1 = outcome_cohort,
    observation_period = observation_period
  )

  # Censor on date
  surv7 <- estimateSingleEventSurvival(cdm,
    targetCohortTable = "exposure_cohort",
    outcomeCohortTable = "cohort1",
    minCellCount = 1,
    censorOnDate = as.Date("2020-05-04")
  )

   expect_true(all(compareNA(surv7 %>% dplyr::select(time) %>% dplyr::pull() %>% unique(), c(0:9))))
   expect_true(all(surv7 %>% dplyr::filter(estimate == "n_risk") %>% dplyr::select(estimate) %>% dplyr::pull() == c(rep(1, 10))))
   expect_true(all(surv7 %>%
                     dplyr::filter(estimate_type == "Cumulative failure probability") %>%
                     dplyr::filter(variable_type == "estimate") %>%
                     dplyr::select(estimate)%>% dplyr::pull() - c(rep(0, 6), 0.5, 0.5, 0.5, 1) < c(0.01)))
   expect_true(all(surv7 %>% dplyr::select(analysis_type) %>% dplyr::pull() == "Single event"))

  CDMConnector::cdmDisconnect(cdm)
})

test_that("different exposure cohort ids", {
  cohort <- dplyr::tibble(
    cohort_definition_id = c(1, 1, 2),
    subject_id = c(1, 2, 3),
    cohort_start_date = c(
      as.Date("2020-01-01"),
      as.Date("2020-01-02"),
      as.Date("2020-01-01")
    ),
    cohort_end_date = c(
      as.Date("2020-01-11"),
      as.Date("2020-01-12"),
      as.Date("2020-01-11")
    )
  )
  outcome_cohort <- dplyr::tibble(
    cohort_definition_id = c(1, 1, 1),
    subject_id = c(1, 2, 3),
    cohort_start_date = c(
      as.Date("2020-01-10"),
      as.Date("2020-01-03"),
      as.Date("2020-01-09")
    ),
    cohort_end_date = c(
      as.Date("2020-01-10"),
      as.Date("2020-01-03"),
      as.Date("2020-01-09")
    )
  )
  observation_period <- dplyr::tibble(
    observation_period_id = c(1, 1, 1),
    person_id = c(1, 2, 3),
    observation_period_start_date = c(
      as.Date("2000-01-01"),
      as.Date("2000-01-02"),
      as.Date("2000-01-01")
    ),
    observation_period_end_date = c(
      as.Date("2023-04-01"),
      as.Date("2023-05-02"),
      as.Date("2023-03-01")
    )
  )
  cdm <- PatientProfiles::mockPatientProfiles(
    cohort1 = cohort,
    cohort2 = outcome_cohort,
    observation_period = observation_period
  )
  surv8 <-
    estimateSingleEventSurvival(
      cdm = cdm,
      targetCohortTable = "cohort1",
      targetCohortId = 1,
      outcomeCohortTable = "cohort2",
      outcomeCohortId = 1,
      minCellCount = 0
    )
   expect_true(all(compareNA(surv8 %>% dplyr::select(time) %>% dplyr::pull() %>% unique(), c(0:9))))
   expect_true(all(surv8 %>% dplyr::filter(estimate == "n_risk") %>% dplyr::select(estimate) %>% dplyr::pull() == c(rep(2, 2), rep(1, 8))))
   expect_true(all(surv8 %>%
                     dplyr::filter(estimate_type == "Cumulative failure probability") %>%
                     dplyr::filter(variable_type == "estimate") %>%
                     dplyr::select(estimate) %>% dplyr::pull() - c(0, rep(0.5, 8), 1) < c(0.01)))
   expect_true(all(surv8 %>% dplyr::select(analysis_type) %>% dplyr::pull() == "Single event"))

   expect_true(all(attr(surv8, "events") %>% dplyr::filter(!is.na(estimate) & variable_type =="n_risk" & variable_level == "timeGap 1") %>% dplyr::select(time) == c(0:9)))
   expect_true(all(attr(surv8, "events") %>%
                     dplyr::filter(variable_type =="n_risk") %>%
                     dplyr::filter(time==0) %>% dplyr::select(estimate) %>%
                     dplyr::pull() == c(2, 2, 2, 2)))

  surv9 <-
    estimateSingleEventSurvival(
      cdm = cdm,
      targetCohortTable = "cohort1",
      targetCohortId = 2,
      outcomeCohortTable = "cohort2",
      outcomeCohortId = 1,
      minCellCount = 1
    )
   expect_true(all(compareNA(surv9 %>% dplyr::select(time) %>% dplyr::pull() %>% unique(), c(0:8))))
   expect_true(all(surv9 %>% dplyr::filter(estimate == "n_risk") %>% dplyr::select(estimate) %>% dplyr::pull() == c(rep(1, 9))))
   expect_true(all(surv9 %>%
                     dplyr::filter(estimate_type == "Cumulative failure probability") %>%
                     dplyr::filter(variable_type == "estimate") %>%
                     dplyr::select(estimate) %>% dplyr::pull() - c(rep(0, 8), 1) < c(0.01)))
   expect_true(all(surv9 %>% dplyr::select(analysis_type) %>% dplyr::pull() == "Single event"))

   expect_true(all(attr(surv9, "events") %>% dplyr::filter(!is.na(estimate) & variable_level == "timeGap 1") %>% dplyr::pull("time") %in%  c(0:8)))
   expect_true(all(attr(surv9, "events") %>%
                     dplyr::filter(variable_type =="n_risk") %>%
                     dplyr::filter(time==0) %>% dplyr::select(estimate) %>%
                     dplyr::pull() %in%  c(1)))
  CDMConnector::cdm_disconnect(cdm)
  })

test_that("expected errors", {
  cdm <- mockMGUS2cdm()

  expect_error(estimateSurvival("cdm", targetCohortTable = "mgus_diagnosis", outcomeCohortTable = "progression"))
  expect_error(estimateSurvival(cdm, targetCohortTable = "mgus_diagnosiss", outcomeCohortTable = "progression"))
  expect_error(estimateSurvival(cdm, targetCohortTable = "mgus_diagnosis", outcomeCohortTable = "outcome"))
  expect_error(estimateSurvival(cdm, targetCohortTable = "mgus_diagnosis", outcomeCohortTable = "progression", outcomeCohortId = c(1, 3)))
  expect_error(estimateSurvival(cdm, targetCohortTable = "mgus_diagnosis", outcomeCohortTable = "progression", outcomeCohortId = 1, timeGap = -3))
  expect_error(estimateSurvival(cdm, targetCohortTable = "mgus_diagnosis", outcomeCohortTable = "progression", outcomeCohortId = 1, timeGap = "time"))
  expect_error(estimateSurvival(cdm, targetCohortTable = "mgus_diagnosis", outcomeCohortTable = "progression", outcomeCohortId = 1, timeGap = NULL))
  expect_error(estimateSurvival(cdm, targetCohortTable = "mgus_diagnosis", outcomeCohortTable = "progression", outcomeCohortId = 1, strata = "age"))
  expect_error(estimateSurvival(cdm, targetCohortTable = "mgus_diagnosis", outcomeCohortTable = "progression", outcomeCohortId = 1, strata = list("name" = "noname")))
  expect_error(estimateSurvival(cdm, targetCohortTable = "mgus_diagnosis", outcomeCohortTable = "progression", outcomeCohortId = 1, censorOnDate = "2020-09-02"))

  CDMConnector::cdmDisconnect(cdm)
})

test_that("return participants", {
  cdm <- mockMGUS2cdm()
  surv1 <- estimateSingleEventSurvival(cdm,
    targetCohortTable = "mgus_diagnosis",
    outcomeCohortTable = "death_cohort",
    returnParticipants = FALSE
  )
  expect_true(is.null(attr(surv1, "participants")))
  surv2 <- estimateSingleEventSurvival(cdm,
    targetCohortTable = "mgus_diagnosis",
    targetCohortId = 1,
    outcomeCohortTable = "death_cohort",
    outcomeCohortId = 1,
    timeGap = 7, returnParticipants = TRUE
  )
  expect_false(is.null(attr(surv2, "participants")))

  expect_equal(
    colnames(survivalParticipants(surv2) %>%
      head(1) %>%
      dplyr::collect()),
    c(
      "cohort_definition_id",
      "subject_id",
      "cohort_start_date",
      "cohort_end_date"
    )
  )

  CDMConnector::cdmDisconnect(cdm)
})

test_that("within cohort survival", {
  cohort <- dplyr::tibble(
    cohort_definition_id = c(1, 1, 1),
    subject_id = c(1, 2, 3),
    cohort_start_date = c(
      as.Date("2020-01-01"),
      as.Date("2020-01-02"),
      as.Date("2020-01-01")
    ),
    cohort_end_date = c(
      as.Date("2020-04-01"),
      as.Date("2020-08-02"),
      as.Date("2021-03-01")
    )
  )
  observation_period <- dplyr::tibble(
    observation_period_id = c(1, 1, 1),
    person_id = c(1, 2, 3),
    observation_period_start_date = c(
      as.Date("2000-01-01"),
      as.Date("2000-01-02"),
      as.Date("2000-01-01")
    ),
    observation_period_end_date = c(
      as.Date("2023-04-01"),
      as.Date("2023-05-02"),
      as.Date("2023-03-01")
    )
  )
  cdm <- PatientProfiles::mockPatientProfiles(
    cohort1 = cohort,
    observation_period = observation_period
  )

  surv <- estimateSingleEventSurvival(cdm,
    targetCohortTable = "cohort1",
    targetCohortId = 1,
    outcomeCohortTable = "cohort1",
    outcomeCohortId = 1,
    outcomeDateVariable = "cohort_end_date",
    timeGap = 7,
    minCellCount = 0
  )
  expect_true(max(attr(surv, "events") %>% dplyr::select(estimate) %>% dplyr::pull(), na.rm = TRUE) == 3)

  CDMConnector::cdmDisconnect(cdm)
})

test_that("strata specific survival", {

  exposure_cohort <- dplyr::tibble(
    subject_id = c(1, 2, 3, 4, 5),
    cohort_definition_id = c(1, 1, 1,1,1),
    cohort_start_date = c(
      as.Date("2000-01-01"),
      as.Date("2010-01-01"),
      as.Date("2000-01-01"),
      as.Date("2010-01-01"),
      as.Date("2010-01-01")
    ),
    cohort_end_date = c(
      as.Date("2020-01-31"),
      as.Date("2012-01-01"),
      as.Date("2021-06-28"),
      as.Date("2012-01-01"),
      as.Date("2012-01-01")
    ),
    sex = c("Female", "Male", "Female", "Male", "Male")
  )
  outcome_cohort <- dplyr::tibble(
    cohort_definition_id = c(1, 1, 1, 1, 1),
    subject_id = c(1, 1, 2, 3, 3),
    cohort_start_date = c(
      as.Date("2020-01-10"),
      as.Date("2020-02-02"),
      as.Date("2011-02-09"),
      as.Date("2020-06-01"),
      as.Date("2020-06-03")
    ),
    cohort_end_date = c(
      as.Date("2020-01-10"),
      as.Date("2020-02-02"),
      as.Date("2011-02-09"),
      as.Date("2020-06-01"),
      as.Date("2020-06-03")
    )
  )
  other_outcome_cohort <- dplyr::tibble(
    cohort_definition_id = c(1),
    subject_id = c(4),
    cohort_start_date = c(
      as.Date("2011-02-09")
    ),
    cohort_end_date = c(
      as.Date("2011-02-09")
    )
  )
  observation_period <- dplyr::tibble(
    observation_period_id = c(1, 2, 3,4,5),
    person_id = c(1, 2, 3,4,5),
    observation_period_start_date = c(
      as.Date("2007-03-21"),
      as.Date("2009-09-09"),
      as.Date("1980-07-20"),
      as.Date("2009-09-09"),
      as.Date("2009-09-09")
    ),
    observation_period_end_date = c(
      as.Date("2022-09-08"),
      as.Date("2015-01-03"),
      as.Date("2023-05-20"),
      as.Date("2015-01-03"),
      as.Date("2015-01-05")
    )
  )

  cdm <- PatientProfiles::mockPatientProfiles(
    exposure_cohort = exposure_cohort,
    cohort1 = outcome_cohort,
    cohort2 = other_outcome_cohort,
    observation_period = observation_period
  )

  surv <- estimateSingleEventSurvival(cdm,
                           targetCohortTable = "exposure_cohort",
                           outcomeCohortTable = "cohort1",
                           strata = list("sex"),
                           minCellCount = 1
  )
  surv_cr <- estimateCompetingRiskSurvival(cdm,
                           targetCohortTable = "exposure_cohort",
                           outcomeCohortTable = "cohort1",
                           competingOutcomeCohortTable = "cohort2",
                           strata = list("sex"),
                           minCellCount = 1
  )

  # only males
  cdm$exposure_cohort_m <- cdm$exposure_cohort %>%
    dplyr::filter(sex=="Male")
  surv_m <- estimateSingleEventSurvival(cdm,
                           targetCohortTable = "exposure_cohort_m",
                           outcomeCohortTable = "cohort1",
                           minCellCount = 1
  )
  surv_cr_m <- estimateCompetingRiskSurvival(cdm,
                            targetCohortTable = "exposure_cohort_m",
                            outcomeCohortTable = "cohort1",
                            competingOutcomeCohortTable = "cohort2",
                            minCellCount = 1
  )

  # overall result should now be the same as the strata of males before filtering
  expect_equal(surv %>%
    dplyr::filter(!is.na(time)) %>%
    dplyr::filter(strata_level == "Male") %>%
    dplyr::pull(),
    surv_m  %>%
    dplyr::filter(!is.na(time)) %>%
    dplyr::pull()
  )
  expect_equal(surv %>%
                 dplyr::filter(is.na(time)) %>%
                 dplyr::filter(strata_level == "Male") %>%
                 dplyr::pull(),
               surv_m  %>%
                 dplyr::filter(is.na(time)) %>%
                 dplyr::pull()
  )
  expect_equal(
    surv %>%
      dplyr::filter(strata_level == "Male") %>%
      dplyr::select("estimate") %>%
      dplyr::pull(),
    surv_m %>%
      dplyr::select("estimate") %>%
      dplyr::pull()
  )


  expect_equal(surv_cr %>%
                 dplyr::filter(!is.na(time)) %>%
                 dplyr::filter(strata_level == "Male") %>%
                 dplyr::pull(),
               surv_cr_m  %>%
                 dplyr::filter(!is.na(time)) %>%
                 dplyr::pull()
  )

  expect_equal(surv_cr %>%
                 dplyr::filter(is.na(time)) %>%
                 dplyr::filter(strata_level == "Male") %>%
                 dplyr::pull(),
               surv_cr_m  %>%
                 dplyr::filter(is.na(time)) %>%
                 dplyr::pull()
  )


  # strata with only one value
  cdm$exposure_cohort <- cdm$exposure_cohort %>% dplyr::mutate(a = "X")
  surv <- estimateSingleEventSurvival(cdm,
                                      targetCohortTable = "exposure_cohort",
                                      outcomeCohortTable = "cohort1",
                                      strata = list("sex", "a"),
                                      minCellCount = 1
  )


  CDMConnector::cdmDisconnect(cdm)


})

test_that("multiple rows per person - same observation period", {

  exposure_cohort <- dplyr::tibble(
    subject_id = c(1, 1, 2, 2, 3,4),
    cohort_definition_id = rep(1,6),
    cohort_start_date = c(
      as.Date("2010-01-01"),
      as.Date("2015-01-01"),
      as.Date("2010-01-01"),
      as.Date("2016-01-01"),
      as.Date("2010-01-01"),
      as.Date("2010-01-01")
    ),
    cohort_end_date = c(
      as.Date("2010-01-01"),
      as.Date("2015-01-01"),
      as.Date("2010-01-01"),
      as.Date("2016-01-01"),
      as.Date("2010-01-01"),
      as.Date("2010-01-01")
    )
  )
  # outcome during first cohort entry for id 1
  # outcome during second cohort entry for id 2
  outcome_cohort <- dplyr::tibble(
    cohort_definition_id = c(1, 1),
    subject_id = c(1, 2),
    cohort_start_date = c(
      as.Date("2012-01-10"),
      as.Date("2017-01-10")
    ),
    cohort_end_date = c(
      as.Date("2012-01-10"),
      as.Date("2017-01-10")
  ))
  observation_period <- dplyr::tibble(
    observation_period_id = c(1, 2,3,4),
    person_id = c(1, 2, 3, 4),
    observation_period_start_date = c(
      as.Date("2007-03-21"),
      as.Date("2006-09-09"),
      as.Date("1980-07-20"),
      as.Date("1980-07-20")
    ),
    observation_period_end_date = c(
      as.Date("2022-09-08"),
      as.Date("2023-01-03"),
      as.Date("2023-05-20"),
      as.Date("2023-05-20")
    )
  )
  competing_cohort <- dplyr::tibble(
    cohort_definition_id = c(1),
    subject_id = c(4),
    cohort_start_date = c(
      as.Date("2012-01-10")
    ),
    cohort_end_date = c(
      as.Date("2012-01-10")
    )
  )

  cdm <- PatientProfiles::mockPatientProfiles(
    exposure_cohort = exposure_cohort,
    cohort1 = outcome_cohort,
    cohort2 = competing_cohort,
    observation_period = observation_period
  )

  expect_no_error(surv <- estimateSingleEventSurvival(cdm,
                                                      targetCohortTable = "exposure_cohort",
                                                      outcomeCohortTable = "cohort1",
                                                      returnParticipants = TRUE
  ))

  # we have three events because subject 2 has two events
 expect_true(max(attr(surv, "summary") %>%
    dplyr::filter(variable_type == "events") %>%
    dplyr::pull("estimate")) == 3)

 # we have five for n_start because subject 2 appears twice
 expect_true(max(attr(surv, "summary") %>%
                   dplyr::filter(variable_type == "number_records") %>%
                   dplyr::pull("estimate")) == 5)

 ## competing risk
 expect_no_error(surv <- estimateCompetingRiskSurvival(cdm,
                                                     targetCohortTable = "exposure_cohort",
                                                     outcomeCohortTable = "cohort1",
                                                     competingOutcomeCohortTable = "cohort2",
                                                     returnParticipants = TRUE
 ))


CDMConnector::cdm_disconnect(cdm)
})

test_that("multiple outcomes competing risk", {
  cdm <- mockMGUS2cdm()

  result <- estimateCompetingRiskSurvival(
    cdm = cdm,
    targetCohortTable = "mgus_diagnosis",
    outcomeCohortTable = "progression_type",
    competingOutcomeCohortTable = "death_cohort"
  )

  x <- result %>%
    dplyr::group_by(dplyr::across(!"estimate")) %>%
    dplyr::summarise(
      number_rows = dplyr::n(),
      distinct_values = dplyr::n_distinct(estimate),
      .groups = "drop"
    ) %>%
    dplyr::summarise(
      number_groups = dplyr::n(),
      multiple_rows = sum(number_rows>1),
      multiple_values = sum(distinct_values > 1)
    )

  expect_true(x$multiple_rows == 0)
  expect_true(x$multiple_values == 0)
})

test_that("empty cohort table", {
cdm <- mockMGUS2cdm()

cdm$progression_type <- cdm$progression_type %>%
  dplyr::filter(.data$cohort_definition_id != 1) %>%
  CDMConnector::recordCohortAttrition("filter")

expect_no_error(result <- estimateCompetingRiskSurvival(
  cdm = cdm,
  targetCohortTable = "mgus_diagnosis",
  outcomeCohortTable = "progression_type",
  competingOutcomeCohortTable = "death_cohort"
))

CDMConnector::cdm_disconnect(cdm)

})

test_that("min cell count", {
  cdm <- mockMGUS2cdm()
  surv <- estimateSingleEventSurvival(cdm,
                                      targetCohortTable = "mgus_diagnosis",
                                      outcomeCohortTable = "death_cohort",
                                      strata = list(
                                        "age" = c("age")
                                      ),
                                      timeGap = 7,
                                      minCellCount = 35)

  expect_true(nrow(attr(surv, "events") %>%
    dplyr::filter(variable_type == "n_risk") %>%
    dplyr::filter(estimate < 35)) == 0)
  expect_true(nrow(attr(surv, "summary") %>%
                     dplyr::filter(variable_type == "n_records") %>%
                     dplyr::filter(estimate < 35)) == 0)

  result <- estimateCompetingRiskSurvival(
    cdm = cdm,
    targetCohortTable = "mgus_diagnosis",
    outcomeCohortTable = "progression_type",
    competingOutcomeCohortTable = "death_cohort",
    minCellCount = 35
  )
  expect_true(nrow(attr(result, "events") %>%
                     dplyr::filter(variable_type == "n_risk") %>%
                     dplyr::filter(estimate < 35)) == 0)

CDMConnector::cdm_disconnect(cdm)

})