Separate functional specifications into own CI job (#2504)

ehildenb · rv-auditor · web-flow · commit 1060bfe0f96a · 2024-06-28T13:02:05.000-06:00
* kevm-pyk/test_prove: separate out functional proofs an rewrite proofs

* Makefile, .github/test-pr: split out functional tests into own test-suite

* kevm-pyk/test_prove: use _test_prove helper for test_prove_dss too

* kevm-pyk/test-prove: organize

* kevm-pyk/test_prove: correct path for vat-spec.k

* kevm-pyk/test_prove: simplify how test_prove_dss uses _test_prove

* kevm-pyk/test_prove: enable --direct-subproof-rules for test_prove_dss

* kevm-pyk/test_prove: remove unused test parameter setting

* Set Version: 1.0.624

* kevm-pyk/test_prove: run functional specs in parallel per-file

* .github/test-pr: rename step name in job

* .github/test-pr: decrease rules proof timeouts

---------

Co-authored-by: devops &lt;devops@runtimeverification.com&gt;
diff --git a/.github/workflows/test-pr.yml b/.github/workflows/test-pr.yml
@@ -111,15 +111,20 @@ jobs:
       matrix:
         include:
           - name: 'Rules (booster)'
-            test-suite: 'test-prove-pyk'
+            test-suite: 'test-prove-rules'
             test-args:
-            timeout: 150
+            timeout: 100
             parallel: 6
           - name: 'Rules (booster-dev)'
-            test-suite: 'test-prove-pyk'
+            test-suite: 'test-prove-rules'
             test-args: '--use-booster-dev'
             timeout: 45
             parallel: 8
+          - name: 'Functional'
+            test-suite: 'test-prove-functional'
+            test-args:
+            timeout: 45
+            parallel: 3
           - name: 'Optimizations'
             test-suite: 'test-prove-optimizations'
             test-args:
@@ -146,7 +151,7 @@ jobs:
         run: docker exec -u github-user kevm-ci-haskell-${{ matrix.test-suite }}-${{ github.sha }} /bin/bash -c 'make poetry'
       - name: 'Build distribution'
         run: docker exec -u github-user kevm-ci-haskell-${{ matrix.test-suite }}-${{ github.sha }} /bin/bash -c 'CXX=clang++-14 poetry -C kevm-pyk run kdist --verbose build -j`nproc` evm-semantics.plugin evm-semantics.haskell'
-      - name: 'Prove Haskell'
+      - name: 'Run proofs'
         run: docker exec -u github-user kevm-ci-haskell-${{ matrix.test-suite }}-${{ github.sha }} /bin/bash -c "make ${{ matrix.test-suite }} PYTEST_ARGS='-vv ${{ matrix.test-args }}' PYTEST_PARALLEL=${{ matrix.parallel }}"
       - name: 'Tear down Docker'
         if: always()
diff --git a/Makefile b/Makefile
@@ -27,7 +27,7 @@ kevm-pyk: poetry-env
 # Tests
 # -----
 
-test: test-integration test-conformance test-prove test-prove-pyk test-prove-kprove test-prove-dss test-interactive
+test: test-integration test-conformance test-prove test-interactive
 
 
 # Conformance Tests
@@ -50,10 +50,13 @@ test-rest-bchain: poetry
 
 # Proof Tests
 
-test-prove: test-prove-pyk test-prove-optimizations test-prove-dss
+test-prove: test-prove-rules test-prove-functional test-prove-optimizations test-prove-dss
 
-test-prove-pyk: poetry
-	$(MAKE) -C kevm-pyk/ test-integration PYTEST_ARGS+="-k test_pyk_prove"
+test-prove-rules: poetry
+	$(MAKE) -C kevm-pyk/ test-integration PYTEST_ARGS+="-k test_prove_rules"
+
+test-prove-functional: poetry
+	$(MAKE) -C kevm-pyk/ test-integration PYTEST_ARGS+="-k test_prove_functional"
 
 test-prove-optimizations: poetry
 	$(MAKE) -C kevm-pyk/ test-integration PYTEST_ARGS+="-k test_prove_optimizations"
diff --git a/kevm-pyk/pyproject.toml b/kevm-pyk/pyproject.toml
@@ -4,7 +4,7 @@ build-backend = "poetry.core.masonry.api"
 
 [tool.poetry]
 name = "kevm-pyk"
-version = "1.0.623"
+version = "1.0.624"
 description = ""
 authors = [
     "Runtime Verification, Inc. <contact@runtimeverification.com>",
diff --git a/kevm-pyk/src/kevm_pyk/__init__.py b/kevm-pyk/src/kevm_pyk/__init__.py
@@ -5,4 +5,4 @@
 if TYPE_CHECKING:
     from typing import Final
 
-VERSION: Final = '1.0.623'
+VERSION: Final = '1.0.624'
diff --git a/kevm-pyk/src/tests/integration/test_prove.py b/kevm-pyk/src/tests/integration/test_prove.py
@@ -2,7 +2,6 @@
 
 import logging
 import sys
-from pathlib import Path
 from typing import TYPE_CHECKING, NamedTuple
 
 import pytest
@@ -24,6 +23,7 @@
 
 if TYPE_CHECKING:
     from collections.abc import Callable
+    from pathlib import Path
     from typing import Final
 
     from pyk.utils import BugReport
@@ -52,18 +52,17 @@ def spec_files(dir_name: str, glob: str) -> tuple[Path, ...]:
 
 
 BENCHMARK_TESTS: Final = spec_files('benchmarks', '*-spec.k')
-FUNCTIONAL_TESTS: Final = spec_files('functional', '*-spec.k')
 ERC20_TESTS: Final = spec_files('erc20', '*/*-spec.k')
 EXAMPLES_TESTS: Final = spec_files('examples', '*-spec.k') + spec_files('examples', '*-spec.md')
 MCD_TESTS: Final = spec_files('mcd', '*-spec.k')
 VAT_TESTS: Final = spec_files('mcd', 'vat*-spec.k')
 NON_VAT_MCD_TESTS: Final = tuple(test for test in MCD_TESTS if test not in VAT_TESTS)
 KONTROL_TESTS: Final = spec_files('kontrol', '*-spec.k')
+FUNCTIONAL_TESTS: Final = spec_files('functional', '*-spec.k')
 
-ALL_TESTS: Final = sum(
+RULE_TESTS: Final = sum(
     [
         BENCHMARK_TESTS,
-        FUNCTIONAL_TESTS,
         ERC20_TESTS,
         EXAMPLES_TESTS,
         NON_VAT_MCD_TESTS,
@@ -72,6 +71,11 @@ def spec_files(dir_name: str, glob: str) -> tuple[Path, ...]:
     (),
 )
 
+ALL_TESTS: Final = sum(
+    [RULE_TESTS, FUNCTIONAL_TESTS, VAT_TESTS],
+    (),
+)
+
 
 def exclude_list(exclude_file: Path) -> list[Path]:
     res = [REPO_ROOT / test_path for test_path in exclude_file.read_text().splitlines()]
@@ -171,6 +175,72 @@ def _target_for_spec(spec_file: Path) -> Target:
     return Target(main_file, main_module_name)
 
 
+def _test_prove(
+    spec_file: Path,
+    kompiled_target_for: Callable[[Path], Path],
+    tmp_path: Path,
+    caplog: LogCaptureFixture,
+    no_use_booster: bool,
+    use_booster_dev: bool,
+    bug_report: BugReport | None,
+    spec_name: str | None,
+    workers: int | None = None,
+    direct_subproof_rules: bool = False,
+) -> None:
+    caplog.set_level(logging.INFO)
+
+    if use_booster_dev and spec_file in FAILING_BOOSTER_DEV_TESTS:
+        pytest.skip()
+
+    if spec_name is not None and str(spec_file).find(spec_name) < 0:
+        pytest.skip()
+
+    # Given
+    log_file = tmp_path / 'log.txt'
+    use_directory = tmp_path / 'kprove'
+    use_directory.mkdir()
+
+    # When
+    try:
+        definition_dir = kompiled_target_for(spec_file)
+        name = str(spec_file.relative_to(SPEC_DIR))
+        break_on_calls = name in TEST_PARAMS and TEST_PARAMS[name].break_on_calls
+        break_on_basic_blocks = name in TEST_PARAMS and TEST_PARAMS[name].break_on_basic_blocks
+        if workers is None:
+            workers = 1 if name not in TEST_PARAMS else TEST_PARAMS[name].workers
+        options = ProveOptions(
+            {
+                'spec_file': spec_file,
+                'definition_dir': definition_dir,
+                'includes': [str(include_dir) for include_dir in config.INCLUDE_DIRS],
+                'save_directory': use_directory,
+                'md_selector': 'foo',  # TODO Ignored flag, this is to avoid KeyError
+                'use_booster': not no_use_booster,
+                'use_booster_dev': use_booster_dev,
+                'bug_report': bug_report,
+                'break_on_calls': break_on_calls,
+                'break_on_basic_blocks': break_on_basic_blocks,
+                'workers': workers,
+                'direct_subproof_rules': direct_subproof_rules,
+            }
+        )
+        exec_prove(options=options)
+        if name in TEST_PARAMS:
+            params = TEST_PARAMS[name]
+            if params.leaf_number is not None and params.main_claim_id is not None:
+                apr_proof = APRProof.read_proof_data(
+                    proof_dir=use_directory,
+                    id=params.main_claim_id,
+                )
+                expected_leaf_number = params.leaf_number
+                actual_leaf_number = leaf_number(apr_proof)
+                assert expected_leaf_number == actual_leaf_number
+    except BaseException:
+        raise
+    finally:
+        log_file.write_text(caplog.text)
+
+
 @pytest.mark.parametrize(
     'spec_file',
     ALL_TESTS,
@@ -223,10 +293,6 @@ def __init__(
 
 
 TEST_PARAMS: dict[str, TParams] = {
-    'mcd/vat-slip-pass-rough-spec.k': TParams(
-        main_claim_id='VAT-SLIP-PASS-ROUGH-SPEC.Vat.slip.pass.rough',
-        leaf_number=1,
-    ),
     'functional/lemmas-spec.k': TParams(workers=8),
     'examples/sum-to-n-foundry-spec.k': TParams(break_on_basic_blocks=True),
 }
@@ -243,10 +309,10 @@ def leaf_number(proof: APRProof) -> int:
 
 @pytest.mark.parametrize(
     'spec_file',
-    ALL_TESTS,
-    ids=[str(spec_file.relative_to(SPEC_DIR)) for spec_file in ALL_TESTS],
+    RULE_TESTS,
+    ids=[str(spec_file.relative_to(SPEC_DIR)) for spec_file in RULE_TESTS],
 )
-def test_pyk_prove(
+def test_prove_rules(
     spec_file: Path,
     kompiled_target_for: Callable[[Path], Path],
     tmp_path: Path,
@@ -256,56 +322,65 @@ def test_pyk_prove(
     bug_report: BugReport | None,
     spec_name: str | None,
 ) -> None:
-    caplog.set_level(logging.INFO)
+    _test_prove(
+        spec_file,
+        kompiled_target_for,
+        tmp_path,
+        caplog,
+        no_use_booster,
+        use_booster_dev,
+        bug_report=bug_report,
+        spec_name=spec_name,
+    )
 
-    if use_booster_dev and spec_file in FAILING_BOOSTER_DEV_TESTS:
-        pytest.skip()
 
-    if spec_name is not None and str(spec_file).find(spec_name) < 0:
-        pytest.skip()
+@pytest.mark.parametrize(
+    'spec_file',
+    FUNCTIONAL_TESTS,
+    ids=[str(spec_file.relative_to(SPEC_DIR)) for spec_file in FUNCTIONAL_TESTS],
+)
+def test_prove_functional(
+    spec_file: Path,
+    kompiled_target_for: Callable[[Path], Path],
+    tmp_path: Path,
+    caplog: LogCaptureFixture,
+    no_use_booster: bool,
+    use_booster_dev: bool,
+    bug_report: BugReport | None,
+    spec_name: str | None,
+) -> None:
+    _test_prove(
+        spec_file,
+        kompiled_target_for,
+        tmp_path,
+        caplog,
+        no_use_booster,
+        use_booster_dev,
+        bug_report=bug_report,
+        spec_name=spec_name,
+        workers=8,
+    )
 
-    # Given
-    log_file = tmp_path / 'log.txt'
-    use_directory = tmp_path / 'kprove'
-    use_directory.mkdir()
 
-    # When
-    try:
-        definition_dir = kompiled_target_for(spec_file)
-        name = str(spec_file.relative_to(SPEC_DIR))
-        break_on_calls = name in TEST_PARAMS and TEST_PARAMS[name].break_on_calls
-        break_on_basic_blocks = name in TEST_PARAMS and TEST_PARAMS[name].break_on_basic_blocks
-        workers = 1 if name not in TEST_PARAMS else TEST_PARAMS[name].workers
-        options = ProveOptions(
-            {
-                'spec_file': spec_file,
-                'definition_dir': definition_dir,
-                'includes': [str(include_dir) for include_dir in config.INCLUDE_DIRS],
-                'save_directory': use_directory,
-                'md_selector': 'foo',  # TODO Ignored flag, this is to avoid KeyError
-                'use_booster': not no_use_booster,
-                'use_booster_dev': use_booster_dev,
-                'bug_report': bug_report,
-                'break_on_calls': break_on_calls,
-                'break_on_basic_blocks': break_on_basic_blocks,
-                'workers': workers,
-            }
-        )
-        exec_prove(options=options)
-        if name in TEST_PARAMS:
-            params = TEST_PARAMS[name]
-            if params.leaf_number is not None and params.main_claim_id is not None:
-                apr_proof = APRProof.read_proof_data(
-                    proof_dir=use_directory,
-                    id=params.main_claim_id,
-                )
-                expected_leaf_number = params.leaf_number
-                actual_leaf_number = leaf_number(apr_proof)
-                assert expected_leaf_number == actual_leaf_number
-    except BaseException:
-        raise
-    finally:
-        log_file.write_text(caplog.text)
+def test_prove_dss(
+    kompiled_target_for: Callable[[Path], Path],
+    tmp_path: Path,
+    caplog: LogCaptureFixture,
+    bug_report: BugReport | None,
+) -> None:
+    spec_file = REPO_ROOT / 'tests/specs/mcd/vat-spec.k'
+    _test_prove(
+        spec_file,
+        kompiled_target_for,
+        tmp_path,
+        caplog,
+        False,
+        False,
+        bug_report=bug_report,
+        spec_name=None,
+        workers=8,
+        direct_subproof_rules=True,
+    )
 
 
 def test_prove_optimizations(
@@ -355,45 +430,3 @@ def _get_optimization_proofs() -> list[APRProof]:
             proof_display = '\n'.join('    ' + line for line in proof_show.show(proof))
             _LOGGER.info(f'Proof {proof.id}:\n{proof_display}')
             assert proof.passed
-
-
-def test_prove_dss(
-    kompiled_target_for: Callable[[Path], Path],
-    tmp_path: Path,
-    caplog: LogCaptureFixture,
-    bug_report: BugReport | None,
-    spec_name: str | None,
-) -> None:
-    spec_file = Path('../tests/specs/mcd/vat-spec.k')
-    caplog.set_level(logging.INFO)
-
-    if spec_name is not None and str(spec_file).find(spec_name) < 0:
-        pytest.skip()
-
-    # Given
-    log_file = tmp_path / 'log.txt'
-    use_directory = tmp_path / 'kprove'
-    use_directory.mkdir()
-
-    # When
-    try:
-        definition_dir = kompiled_target_for(spec_file)
-        options = ProveOptions(
-            {
-                'spec_file': spec_file,
-                'definition_dir': definition_dir,
-                'includes': [str(include_dir) for include_dir in config.INCLUDE_DIRS],
-                'save_directory': use_directory,
-                'md_selector': 'foo',  # TODO Ignored flag, this is to avoid KeyError
-                'use_booster': True,
-                'bug_report': bug_report,
-                'break_on_calls': False,
-                'workers': 8,
-                'direct_subproof_rules': True,
-            }
-        )
-        exec_prove(options=options)
-    except BaseException:
-        raise
-    finally:
-        log_file.write_text(caplog.text)
diff --git a/package/version b/package/version
@@ -1 +1 @@
-1.0.623
+1.0.624