libcxx/utils/synchronize_csv_status_files.py

f117f0a7SLouis Dionne#!/usr/bin/env python3
f117f0a7SLouis Dionne# ===----------------------------------------------------------------------===##
f117f0a7SLouis Dionne#
f117f0a7SLouis Dionne# Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
f117f0a7SLouis Dionne# See https://llvm.org/LICENSE.txt for license information.
f117f0a7SLouis Dionne# SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
f117f0a7SLouis Dionne#
f117f0a7SLouis Dionne# ===----------------------------------------------------------------------===##
f117f0a7SLouis Dionne
f117f0a7SLouis Dionnefrom typing import List, Dict, Tuple, Optional
c2cac69dSLouis Dionneimport copy
f117f0a7SLouis Dionneimport csv
f117f0a7SLouis Dionneimport itertools
f117f0a7SLouis Dionneimport json
f117f0a7SLouis Dionneimport os
f117f0a7SLouis Dionneimport pathlib
f117f0a7SLouis Dionneimport re
f117f0a7SLouis Dionneimport subprocess
f117f0a7SLouis Dionne
f117f0a7SLouis Dionne# Number of the 'Libc++ Standards Conformance' project on Github
f117f0a7SLouis DionneLIBCXX_CONFORMANCE_PROJECT = '31'
f117f0a7SLouis Dionne
c2cac69dSLouis Dionnedef extract_between_markers(text: str, begin_marker: str, end_marker: str) -> Optional[str]:
c2cac69dSLouis Dionne    """
c2cac69dSLouis Dionne    Given a string containing special markers, extract everything located beetwen these markers.
c2cac69dSLouis Dionne
c2cac69dSLouis Dionne    If the beginning marker is not found, None is returned. If the beginning marker is found but
c2cac69dSLouis Dionne    there is no end marker, it is an error (this is done to avoid silently accepting inputs that
c2cac69dSLouis Dionne    are erroneous by mistake).
c2cac69dSLouis Dionne    """
c2cac69dSLouis Dionne    start = text.find(begin_marker)
c2cac69dSLouis Dionne    if start == -1:
c2cac69dSLouis Dionne        return None
c2cac69dSLouis Dionne
c2cac69dSLouis Dionne    start += len(begin_marker) # skip the marker itself
c2cac69dSLouis Dionne    end = text.find(end_marker, start)
c2cac69dSLouis Dionne    if end == -1:
c2cac69dSLouis Dionne        raise ArgumentError(f"Could not find end marker {end_marker} in: {text[start:]}")
c2cac69dSLouis Dionne
c2cac69dSLouis Dionne    return text[start:end]
c2cac69dSLouis Dionne
84fa7b43SLouis Dionneclass PaperStatus:
84fa7b43SLouis Dionne    TODO = 1
84fa7b43SLouis Dionne    IN_PROGRESS = 2
84fa7b43SLouis Dionne    PARTIAL = 3
84fa7b43SLouis Dionne    DONE = 4
84fa7b43SLouis Dionne    NOTHING_TO_DO = 5
84fa7b43SLouis Dionne
84fa7b43SLouis Dionne    _status: int
84fa7b43SLouis Dionne
84fa7b43SLouis Dionne    _original: Optional[str]
84fa7b43SLouis Dionne    """
84fa7b43SLouis Dionne    Optional string from which the paper status was created. This is used to carry additional
84fa7b43SLouis Dionne    information from CSV rows, like any notes associated to the status.
84fa7b43SLouis Dionne    """
84fa7b43SLouis Dionne
84fa7b43SLouis Dionne    def __init__(self, status: int, original: Optional[str] = None):
84fa7b43SLouis Dionne        self._status = status
84fa7b43SLouis Dionne        self._original = original
84fa7b43SLouis Dionne
84fa7b43SLouis Dionne    def __eq__(self, other) -> bool:
84fa7b43SLouis Dionne        return self._status == other._status
84fa7b43SLouis Dionne
84fa7b43SLouis Dionne    def __lt__(self, other) -> bool:
84fa7b43SLouis Dionne        relative_order = {
84fa7b43SLouis Dionne            PaperStatus.TODO: 0,
84fa7b43SLouis Dionne            PaperStatus.IN_PROGRESS: 1,
84fa7b43SLouis Dionne            PaperStatus.PARTIAL: 2,
84fa7b43SLouis Dionne            PaperStatus.DONE: 3,
84fa7b43SLouis Dionne            PaperStatus.NOTHING_TO_DO: 3,
84fa7b43SLouis Dionne        }
84fa7b43SLouis Dionne        return relative_order[self._status] < relative_order[other._status]
84fa7b43SLouis Dionne
84fa7b43SLouis Dionne    @staticmethod
84fa7b43SLouis Dionne    def from_csv_entry(entry: str):
84fa7b43SLouis Dionne        """
84fa7b43SLouis Dionne        Parse a paper status out of a CSV row entry. Entries can look like:
84fa7b43SLouis Dionne        - '' (an empty string, which means the paper is not done yet)
84fa7b43SLouis Dionne        - '|In Progress|'
84fa7b43SLouis Dionne        - '|Partial|'
84fa7b43SLouis Dionne        - '|Complete|'
84fa7b43SLouis Dionne        - '|Nothing To Do|'
84fa7b43SLouis Dionne        """
84fa7b43SLouis Dionne        if entry == '':
84fa7b43SLouis Dionne            return PaperStatus(PaperStatus.TODO, entry)
c2cac69dSLouis Dionne        elif entry == '|In Progress|':
84fa7b43SLouis Dionne            return PaperStatus(PaperStatus.IN_PROGRESS, entry)
c2cac69dSLouis Dionne        elif entry == '|Partial|':
84fa7b43SLouis Dionne            return PaperStatus(PaperStatus.PARTIAL, entry)
c2cac69dSLouis Dionne        elif entry == '|Complete|':
84fa7b43SLouis Dionne            return PaperStatus(PaperStatus.DONE, entry)
c2cac69dSLouis Dionne        elif entry == '|Nothing To Do|':
84fa7b43SLouis Dionne            return PaperStatus(PaperStatus.NOTHING_TO_DO, entry)
84fa7b43SLouis Dionne        else:
84fa7b43SLouis Dionne            raise RuntimeError(f'Unexpected CSV entry for status: {entry}')
84fa7b43SLouis Dionne
84fa7b43SLouis Dionne    @staticmethod
84fa7b43SLouis Dionne    def from_github_issue(issue: Dict):
84fa7b43SLouis Dionne        """
84fa7b43SLouis Dionne        Parse a paper status out of a Github issue obtained from querying a Github project.
84fa7b43SLouis Dionne        """
84fa7b43SLouis Dionne        if 'status' not in issue:
84fa7b43SLouis Dionne            return PaperStatus(PaperStatus.TODO)
84fa7b43SLouis Dionne        elif issue['status'] == 'Todo':
84fa7b43SLouis Dionne            return PaperStatus(PaperStatus.TODO)
84fa7b43SLouis Dionne        elif issue['status'] == 'In Progress':
84fa7b43SLouis Dionne            return PaperStatus(PaperStatus.IN_PROGRESS)
84fa7b43SLouis Dionne        elif issue['status'] == 'Partial':
84fa7b43SLouis Dionne            return PaperStatus(PaperStatus.PARTIAL)
84fa7b43SLouis Dionne        elif issue['status'] == 'Done':
84fa7b43SLouis Dionne            return PaperStatus(PaperStatus.DONE)
84fa7b43SLouis Dionne        elif issue['status'] == 'Nothing To Do':
84fa7b43SLouis Dionne            return PaperStatus(PaperStatus.NOTHING_TO_DO)
84fa7b43SLouis Dionne        else:
84fa7b43SLouis Dionne            raise RuntimeError(f"Received unrecognizable Github issue status: {issue['status']}")
84fa7b43SLouis Dionne
84fa7b43SLouis Dionne    def to_csv_entry(self) -> str:
84fa7b43SLouis Dionne        """
84fa7b43SLouis Dionne        Return the issue state formatted for a CSV entry. The status is formatted as '|Complete|',
84fa7b43SLouis Dionne        '|In Progress|', etc.
84fa7b43SLouis Dionne        """
84fa7b43SLouis Dionne        mapping = {
84fa7b43SLouis Dionne            PaperStatus.TODO: '',
84fa7b43SLouis Dionne            PaperStatus.IN_PROGRESS: '|In Progress|',
84fa7b43SLouis Dionne            PaperStatus.PARTIAL: '|Partial|',
84fa7b43SLouis Dionne            PaperStatus.DONE: '|Complete|',
84fa7b43SLouis Dionne            PaperStatus.NOTHING_TO_DO: '|Nothing To Do|',
84fa7b43SLouis Dionne        }
84fa7b43SLouis Dionne        return self._original if self._original is not None else mapping[self._status]
84fa7b43SLouis Dionne
f117f0a7SLouis Dionneclass PaperInfo:
f117f0a7SLouis Dionne    paper_number: str
f117f0a7SLouis Dionne    """
f117f0a7SLouis Dionne    Identifier for the paper or the LWG issue. This must be something like 'PnnnnRx', 'Nxxxxx' or 'LWGxxxxx'.
f117f0a7SLouis Dionne    """
f117f0a7SLouis Dionne
f117f0a7SLouis Dionne    paper_name: str
f117f0a7SLouis Dionne    """
f117f0a7SLouis Dionne    Plain text string representing the name of the paper.
f117f0a7SLouis Dionne    """
f117f0a7SLouis Dionne
84fa7b43SLouis Dionne    status: PaperStatus
84fa7b43SLouis Dionne    """
84fa7b43SLouis Dionne    Status of the paper/issue. This can be complete, in progress, partial, or done.
84fa7b43SLouis Dionne    """
84fa7b43SLouis Dionne
f117f0a7SLouis Dionne    meeting: Optional[str]
f117f0a7SLouis Dionne    """
f117f0a7SLouis Dionne    Plain text string representing the meeting at which the paper/issue was voted.
f117f0a7SLouis Dionne    """
f117f0a7SLouis Dionne
f117f0a7SLouis Dionne    first_released_version: Optional[str]
f117f0a7SLouis Dionne    """
f117f0a7SLouis Dionne    First version of LLVM in which this paper/issue was resolved.
f117f0a7SLouis Dionne    """
f117f0a7SLouis Dionne
c2cac69dSLouis Dionne    notes: Optional[str]
f117f0a7SLouis Dionne    """
c2cac69dSLouis Dionne    Optional plain text string representing notes to associate to the paper.
c2cac69dSLouis Dionne    This is used to populate the "Notes" column in the CSV status pages.
f117f0a7SLouis Dionne    """
f117f0a7SLouis Dionne
f117f0a7SLouis Dionne    original: Optional[object]
f117f0a7SLouis Dionne    """
f117f0a7SLouis Dionne    Object from which this PaperInfo originated. This is used to track the CSV row or Github issue that
f117f0a7SLouis Dionne    was used to generate this PaperInfo and is useful for error reporting purposes.
f117f0a7SLouis Dionne    """
f117f0a7SLouis Dionne
f117f0a7SLouis Dionne    def __init__(self, paper_number: str, paper_name: str,
84fa7b43SLouis Dionne                       status: PaperStatus,
f117f0a7SLouis Dionne                       meeting: Optional[str] = None,
f117f0a7SLouis Dionne                       first_released_version: Optional[str] = None,
c2cac69dSLouis Dionne                       notes: Optional[str] = None,
f117f0a7SLouis Dionne                       original: Optional[object] = None):
f117f0a7SLouis Dionne        self.paper_number = paper_number
f117f0a7SLouis Dionne        self.paper_name = paper_name
f117f0a7SLouis Dionne        self.status = status
84fa7b43SLouis Dionne        self.meeting = meeting
f117f0a7SLouis Dionne        self.first_released_version = first_released_version
c2cac69dSLouis Dionne        self.notes = notes
f117f0a7SLouis Dionne        self.original = original
f117f0a7SLouis Dionne
f117f0a7SLouis Dionne    def for_printing(self) -> Tuple[str, str, str, str, str, str]:
f117f0a7SLouis Dionne        return (
f117f0a7SLouis Dionne            f'`{self.paper_number} <https://wg21.link/{self.paper_number}>`__',
f117f0a7SLouis Dionne            self.paper_name,
f117f0a7SLouis Dionne            self.meeting if self.meeting is not None else '',
84fa7b43SLouis Dionne            self.status.to_csv_entry(),
f117f0a7SLouis Dionne            self.first_released_version if self.first_released_version is not None else '',
c2cac69dSLouis Dionne            self.notes if self.notes is not None else '',
f117f0a7SLouis Dionne        )
f117f0a7SLouis Dionne
f117f0a7SLouis Dionne    def __repr__(self) -> str:
f117f0a7SLouis Dionne        return repr(self.original) if self.original is not None else repr(self.for_printing())
f117f0a7SLouis Dionne
f117f0a7SLouis Dionne    @staticmethod
f117f0a7SLouis Dionne    def from_csv_row(row: Tuple[str, str, str, str, str, str]):# -> PaperInfo:
f117f0a7SLouis Dionne        """
f117f0a7SLouis Dionne        Given a row from one of our status-tracking CSV files, create a PaperInfo object representing that row.
f117f0a7SLouis Dionne        """
f117f0a7SLouis Dionne        # Extract the paper number from the first column
f117f0a7SLouis Dionne        match = re.search(r"((P[0-9R]+)|(LWG[0-9]+)|(N[0-9]+))\s+", row[0])
f117f0a7SLouis Dionne        if match is None:
f117f0a7SLouis Dionne            raise RuntimeError(f"Can't parse paper/issue number out of row: {row}")
f117f0a7SLouis Dionne
f117f0a7SLouis Dionne        return PaperInfo(
f117f0a7SLouis Dionne            paper_number=match.group(1),
f117f0a7SLouis Dionne            paper_name=row[1],
84fa7b43SLouis Dionne            status=PaperStatus.from_csv_entry(row[3]),
f117f0a7SLouis Dionne            meeting=row[2] or None,
f117f0a7SLouis Dionne            first_released_version=row[4] or None,
c2cac69dSLouis Dionne            notes=row[5] or None,
f117f0a7SLouis Dionne            original=row,
f117f0a7SLouis Dionne        )
f117f0a7SLouis Dionne
f117f0a7SLouis Dionne    @staticmethod
f117f0a7SLouis Dionne    def from_github_issue(issue: Dict):# -> PaperInfo:
f117f0a7SLouis Dionne        """
f117f0a7SLouis Dionne        Create a PaperInfo object from the Github issue information obtained from querying a Github Project.
f117f0a7SLouis Dionne        """
f117f0a7SLouis Dionne        # Extract the paper number from the issue title
f117f0a7SLouis Dionne        match = re.search(r"((P[0-9R]+)|(LWG[0-9]+)|(N[0-9]+)):", issue['title'])
f117f0a7SLouis Dionne        if match is None:
f117f0a7SLouis Dionne            raise RuntimeError(f"Issue doesn't have a title that we know how to parse: {issue}")
f117f0a7SLouis Dionne        paper = match.group(1)
f117f0a7SLouis Dionne
c2cac69dSLouis Dionne        # Extract any notes from the Github issue and populate the RST notes with them
c2cac69dSLouis Dionne        issue_description = issue['content']['body']
c2cac69dSLouis Dionne        notes = extract_between_markers(issue_description, 'BEGIN-RST-NOTES', 'END-RST-NOTES')
c2cac69dSLouis Dionne        notes = notes.strip() if notes is not None else notes
f117f0a7SLouis Dionne
f117f0a7SLouis Dionne        return PaperInfo(
f117f0a7SLouis Dionne            paper_number=paper,
f117f0a7SLouis Dionne            paper_name=issue['title'],
84fa7b43SLouis Dionne            status=PaperStatus.from_github_issue(issue),
f117f0a7SLouis Dionne            meeting=issue.get('meeting Voted', None),
f117f0a7SLouis Dionne            first_released_version=None, # TODO
c2cac69dSLouis Dionne            notes=notes,
f117f0a7SLouis Dionne            original=issue,
f117f0a7SLouis Dionne        )
f117f0a7SLouis Dionne
c2cac69dSLouis Dionnedef merge(paper: PaperInfo, gh: PaperInfo) -> PaperInfo:
c2cac69dSLouis Dionne    """
c2cac69dSLouis Dionne    Merge a paper coming from a CSV row with a corresponding Github-tracked paper.
c2cac69dSLouis Dionne
c2cac69dSLouis Dionne    If the CSV row has a status that is "less advanced" than the Github issue, simply update the CSV
c2cac69dSLouis Dionne    row with the newer status. Otherwise, report an error if they have a different status because
c2cac69dSLouis Dionne    something must be wrong.
c2cac69dSLouis Dionne
6b3b63cdSLouis Dionne    We don't update issues from 'To Do' to 'In Progress', since that only creates churn and the
6b3b63cdSLouis Dionne    status files aim to document user-facing functionality in releases, for which 'In Progress'
6b3b63cdSLouis Dionne    is not useful.
6b3b63cdSLouis Dionne
c2cac69dSLouis Dionne    In case we don't update the CSV row's status, we still take any updated notes coming
c2cac69dSLouis Dionne    from the Github issue.
c2cac69dSLouis Dionne    """
6b3b63cdSLouis Dionne    if paper.status == PaperStatus(PaperStatus.TODO) and gh.status == PaperStatus(PaperStatus.IN_PROGRESS):
6b3b63cdSLouis Dionne        result = copy.deepcopy(paper)
6b3b63cdSLouis Dionne        result.notes = gh.notes
6b3b63cdSLouis Dionne    elif paper.status < gh.status:
6b3b63cdSLouis Dionne        result = copy.deepcopy(gh)
6b3b63cdSLouis Dionne    elif paper.status == gh.status:
6b3b63cdSLouis Dionne        result = copy.deepcopy(paper)
6b3b63cdSLouis Dionne        result.notes = gh.notes
c2cac69dSLouis Dionne    else:
6b3b63cdSLouis Dionne        print(f"We found a CSV row and a Github issue with different statuses:\nrow: {paper}\nGithub issue: {gh}")
6b3b63cdSLouis Dionne        result = copy.deepcopy(paper)
6b3b63cdSLouis Dionne    return result
c2cac69dSLouis Dionne
f117f0a7SLouis Dionnedef load_csv(file: pathlib.Path) -> List[Tuple]:
f117f0a7SLouis Dionne    rows = []
f117f0a7SLouis Dionne    with open(file, newline='') as f:
f117f0a7SLouis Dionne        reader = csv.reader(f, delimiter=',')
f117f0a7SLouis Dionne        for row in reader:
f117f0a7SLouis Dionne            rows.append(row)
f117f0a7SLouis Dionne    return rows
f117f0a7SLouis Dionne
f117f0a7SLouis Dionnedef write_csv(output: pathlib.Path, rows: List[Tuple]):
f117f0a7SLouis Dionne    with open(output, 'w', newline='') as f:
f117f0a7SLouis Dionne        writer = csv.writer(f, quoting=csv.QUOTE_ALL, lineterminator='\n')
f117f0a7SLouis Dionne        for row in rows:
f117f0a7SLouis Dionne            writer.writerow(row)
f117f0a7SLouis Dionne
*1b03747eSLouis Dionnedef create_github_issue(paper: PaperInfo, labels: List[str]) -> None:
*1b03747eSLouis Dionne    """
*1b03747eSLouis Dionne    Create a new Github issue representing the given PaperInfo.
*1b03747eSLouis Dionne    """
*1b03747eSLouis Dionne    paper_name = paper.paper_name.replace('``', '`').replace('\\', '')
*1b03747eSLouis Dionne
*1b03747eSLouis Dionne    create_cli = ['gh', 'issue', 'create', '--repo', 'llvm/llvm-project',
*1b03747eSLouis Dionne                    '--title', f'{paper.paper_number}: {paper_name}',
*1b03747eSLouis Dionne                    '--body', f'**Link:** https://wg21.link/{paper.paper_number}',
*1b03747eSLouis Dionne                    '--project', 'libc++ Standards Conformance',
*1b03747eSLouis Dionne                    '--label', 'libc++']
*1b03747eSLouis Dionne
*1b03747eSLouis Dionne    for label in labels:
*1b03747eSLouis Dionne        create_cli += ['--label', label]
*1b03747eSLouis Dionne
*1b03747eSLouis Dionne    print("Do you want to create the following issue?")
*1b03747eSLouis Dionne    print(create_cli)
*1b03747eSLouis Dionne    answer = input("y/n: ")
*1b03747eSLouis Dionne    if answer == 'n':
*1b03747eSLouis Dionne        print("Not creating issue")
*1b03747eSLouis Dionne        return
*1b03747eSLouis Dionne    elif answer != 'y':
*1b03747eSLouis Dionne        print(f"Invalid answer {answer}, skipping")
*1b03747eSLouis Dionne        return
*1b03747eSLouis Dionne
*1b03747eSLouis Dionne    print("Creating issue")
*1b03747eSLouis Dionne    issue_link = subprocess.check_output(create_cli).decode().strip()
*1b03747eSLouis Dionne    print(f"Created tracking issue for {paper.paper_number}: {issue_link}")
*1b03747eSLouis Dionne
*1b03747eSLouis Dionne    # Retrieve the "Github project item ID" by re-adding the issue to the project again,
*1b03747eSLouis Dionne    # even though we created it inside the project in the first place.
*1b03747eSLouis Dionne    item_add_cli = ['gh', 'project', 'item-add', LIBCXX_CONFORMANCE_PROJECT, '--owner', 'llvm', '--url', issue_link, '--format', 'json']
*1b03747eSLouis Dionne    item = json.loads(subprocess.check_output(item_add_cli).decode().strip())
*1b03747eSLouis Dionne
*1b03747eSLouis Dionne    # Then, adjust the 'Meeting Voted' field of that item.
*1b03747eSLouis Dionne    meeting_voted_cli = ['gh', 'project', 'item-edit',
*1b03747eSLouis Dionne                                '--project-id', 'PVT_kwDOAQWwKc4AlOgt',
*1b03747eSLouis Dionne                                '--field-id', 'PVTF_lADOAQWwKc4AlOgtzgdUEXI', '--text', paper.meeting,
*1b03747eSLouis Dionne                                '--id', item['id']]
*1b03747eSLouis Dionne    subprocess.check_call(meeting_voted_cli)
*1b03747eSLouis Dionne
*1b03747eSLouis Dionne    # And also adjust the 'Status' field of the item to 'To Do'.
*1b03747eSLouis Dionne    status_cli = ['gh', 'project', 'item-edit',
*1b03747eSLouis Dionne                                '--project-id', 'PVT_kwDOAQWwKc4AlOgt',
*1b03747eSLouis Dionne                                '--field-id', 'PVTSSF_lADOAQWwKc4AlOgtzgdUBak', '--single-select-option-id', 'f75ad846',
*1b03747eSLouis Dionne                                '--id', item['id']]
*1b03747eSLouis Dionne    subprocess.check_call(status_cli)
*1b03747eSLouis Dionne
*1b03747eSLouis Dionnedef sync_csv(rows: List[Tuple], from_github: List[PaperInfo], create_new: bool, labels: List[str] = None) -> List[Tuple]:
f117f0a7SLouis Dionne    """
f117f0a7SLouis Dionne    Given a list of CSV rows representing an existing status file and a list of PaperInfos representing
f117f0a7SLouis Dionne    up-to-date (but potentially incomplete) tracking information from Github, this function returns the
f117f0a7SLouis Dionne    new CSV rows synchronized with the up-to-date information.
f117f0a7SLouis Dionne
*1b03747eSLouis Dionne    If `create_new` is True and a paper from the CSV file is not tracked on Github yet, this also prompts
*1b03747eSLouis Dionne    to create a new issue on Github for tracking it. In that case the created issue is tagged with the
*1b03747eSLouis Dionne    provided labels.
*1b03747eSLouis Dionne
f117f0a7SLouis Dionne    Note that this only tracks changes from 'not implemented' issues to 'implemented'. If an up-to-date
f117f0a7SLouis Dionne    PaperInfo reports that a paper is not implemented but the existing CSV rows report it as implemented,
f117f0a7SLouis Dionne    it is an error (i.e. the result is not a CSV row where the paper is *not* implemented).
f117f0a7SLouis Dionne    """
f117f0a7SLouis Dionne    results = [rows[0]] # Start with the header
f117f0a7SLouis Dionne    for row in rows[1:]: # Skip the header
f117f0a7SLouis Dionne        # If the row contains empty entries, this is a "separator row" between meetings.
f117f0a7SLouis Dionne        # Preserve it as-is.
f117f0a7SLouis Dionne        if row[0] == "":
f117f0a7SLouis Dionne            results.append(row)
f117f0a7SLouis Dionne            continue
f117f0a7SLouis Dionne
f117f0a7SLouis Dionne        paper = PaperInfo.from_csv_row(row)
f117f0a7SLouis Dionne
84fa7b43SLouis Dionne        # Find any Github issues tracking this paper. Each row must have one and exactly one Github
84fa7b43SLouis Dionne        # issue tracking it, which we validate below.
f117f0a7SLouis Dionne        tracking = [gh for gh in from_github if paper.paper_number == gh.paper_number]
f117f0a7SLouis Dionne
*1b03747eSLouis Dionne        # If there's more than one tracking issue, something is weird.
*1b03747eSLouis Dionne        if len(tracking) > 1:
*1b03747eSLouis Dionne            print(f"Found a row with more than one tracking issue: {row}\ntracked by: {tracking}")
84fa7b43SLouis Dionne            results.append(row)
84fa7b43SLouis Dionne            continue
f117f0a7SLouis Dionne
*1b03747eSLouis Dionne        # If there is no tracking issue for that row and we are creating new issues, do that.
*1b03747eSLouis Dionne        # Otherwise just log that we're missing an issue.
*1b03747eSLouis Dionne        if len(tracking) == 0:
*1b03747eSLouis Dionne            if create_new:
*1b03747eSLouis Dionne                assert labels is not None, "Missing labels when creating new Github issues"
*1b03747eSLouis Dionne                create_github_issue(paper, labels=labels)
*1b03747eSLouis Dionne            else:
*1b03747eSLouis Dionne                print(f"Can't find any Github issue for CSV row: {row}")
84fa7b43SLouis Dionne            results.append(row)
84fa7b43SLouis Dionne            continue
f117f0a7SLouis Dionne
c2cac69dSLouis Dionne        results.append(merge(paper, tracking[0]).for_printing())
f117f0a7SLouis Dionne
f117f0a7SLouis Dionne    return results
f117f0a7SLouis Dionne
*1b03747eSLouis DionneCSV_FILES_TO_SYNC = {
*1b03747eSLouis Dionne    'Cxx17Issues.csv': ['c++17', 'lwg-issue'],
*1b03747eSLouis Dionne    'Cxx17Papers.csv': ['c++17', 'wg21 paper'],
*1b03747eSLouis Dionne    'Cxx20Issues.csv': ['c++20', 'lwg-issue'],
*1b03747eSLouis Dionne    'Cxx20Papers.csv': ['c++20', 'wg21 paper'],
*1b03747eSLouis Dionne    'Cxx23Issues.csv': ['c++23', 'lwg-issue'],
*1b03747eSLouis Dionne    'Cxx23Papers.csv': ['c++23', 'wg21 paper'],
*1b03747eSLouis Dionne    'Cxx2cIssues.csv': ['c++26', 'lwg-issue'],
*1b03747eSLouis Dionne    'Cxx2cPapers.csv': ['c++26', 'wg21 paper'],
*1b03747eSLouis Dionne}
f117f0a7SLouis Dionne
*1b03747eSLouis Dionnedef main(argv):
*1b03747eSLouis Dionne    import argparse
*1b03747eSLouis Dionne    parser = argparse.ArgumentParser(prog='synchronize-status-files',
*1b03747eSLouis Dionne        description='Synchronize the libc++ conformance status files with Github issues')
*1b03747eSLouis Dionne    parser.add_argument('--validate-only', action='store_true',
*1b03747eSLouis Dionne        help="Only perform the data validation of CSV files.")
*1b03747eSLouis Dionne    parser.add_argument('--create-new', action='store_true',
*1b03747eSLouis Dionne        help="Create new Github issues for CSV rows that do not correspond to any existing Github issue.")
*1b03747eSLouis Dionne    parser.add_argument('--load-github-from', type=str,
*1b03747eSLouis Dionne        help="A json file to load the Github project information from instead of querying the API. This is useful for testing to avoid rate limiting.")
*1b03747eSLouis Dionne    args = parser.parse_args(argv)
*1b03747eSLouis Dionne
f117f0a7SLouis Dionne    libcxx_root = pathlib.Path(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))
f117f0a7SLouis Dionne
*1b03747eSLouis Dionne    # Perform data validation for all the CSV files.
*1b03747eSLouis Dionne    print("Performing data validation of the CSV files")
*1b03747eSLouis Dionne    for filename in CSV_FILES_TO_SYNC:
*1b03747eSLouis Dionne        csv = load_csv(libcxx_root / 'docs' / 'Status' / filename)
*1b03747eSLouis Dionne        for row in csv[1:]: # Skip the header
*1b03747eSLouis Dionne            if row[0] != "": # Skip separator rows
*1b03747eSLouis Dionne                PaperInfo.from_csv_row(row)
*1b03747eSLouis Dionne
*1b03747eSLouis Dionne    if args.validate_only:
*1b03747eSLouis Dionne        return
*1b03747eSLouis Dionne
*1b03747eSLouis Dionne    # Load all the Github issues tracking papers from Github.
*1b03747eSLouis Dionne    if args.load_github_from:
*1b03747eSLouis Dionne        print(f"Loading all issues from {args.load_github_from}")
*1b03747eSLouis Dionne        with open(args.load_github_from, 'r') as f:
*1b03747eSLouis Dionne            project_info = json.load(f)
*1b03747eSLouis Dionne    else:
f117f0a7SLouis Dionne        print("Loading all issues from Github")
f117f0a7SLouis Dionne        gh_command_line = ['gh', 'project', 'item-list', LIBCXX_CONFORMANCE_PROJECT, '--owner', 'llvm', '--format', 'json', '--limit', '9999999']
f117f0a7SLouis Dionne        project_info = json.loads(subprocess.check_output(gh_command_line))
f117f0a7SLouis Dionne    from_github = [PaperInfo.from_github_issue(i) for i in project_info['items']]
f117f0a7SLouis Dionne
*1b03747eSLouis Dionne    # Synchronize CSV files with the Github issues.
*1b03747eSLouis Dionne    for (filename, labels) in CSV_FILES_TO_SYNC.items():
f117f0a7SLouis Dionne        print(f"Synchronizing {filename} with Github issues")
f117f0a7SLouis Dionne        file = libcxx_root / 'docs' / 'Status' / filename
f117f0a7SLouis Dionne        csv = load_csv(file)
*1b03747eSLouis Dionne        synced = sync_csv(csv, from_github, create_new=args.create_new, labels=labels)
f117f0a7SLouis Dionne        write_csv(file, synced)
f117f0a7SLouis Dionne
f117f0a7SLouis Dionneif __name__ == '__main__':
*1b03747eSLouis Dionne    import sys
*1b03747eSLouis Dionne    main(sys.argv[1:])