Spaces:

hahunavth
/

kaggle-utils

Sleeping

App Files Files Community

hahunavth commited on Nov 11, 2023

Commit

c3ece9d

•

1 Parent(s): 2b0538d

add cron server

Browse files

Files changed (18) hide show

.gitignore +1 -1
.idea/.gitignore +8 -8
.idea/kaggle-utils.iml +7 -7
.idea/misc.xml +6 -6
.idea/modules.xml +7 -7
.idea/vcs.xml +5 -5
Dockerfile +20 -0
cli.py +50 -50
config/aasist-train.json +0 -8
google_sheet.py +125 -62
kaggle_service.py +582 -582
logger.py +58 -52
main.py +109 -99
requirements.txt +8 -3
run.py +130 -0
run_stt.py +68 -0
test.ipynb +160 -160
version.py +1 -1

.gitignore CHANGED Viewed

	@@ -1,2 +1,2 @@
1	- tmp
2	__pycache__


1	+ tmp
2	__pycache__

.idea/.gitignore CHANGED Viewed

@@ -1,8 +1,8 @@
-# Default ignored files
-/shelf/
-/workspace.xml
-# Editor-based HTTP Client requests
-/httpRequests/
-# Datasource local storage ignored files
-/dataSources/
-/dataSources.local.xml

+# Default ignored files
+/shelf/
+/workspace.xml
+# Editor-based HTTP Client requests
+/httpRequests/
+# Datasource local storage ignored files
+/dataSources/
+/dataSources.local.xml

.idea/kaggle-utils.iml CHANGED Viewed

@@ -1,8 +1,8 @@
-<?xml version="1.0" encoding="UTF-8"?>
-<module type="PYTHON_MODULE" version="4">
-  <component name="NewModuleRootManager">
-    <content url="file://$MODULE_DIR$" />
-    <orderEntry type="inheritedJdk" />
-    <orderEntry type="sourceFolder" forTests="false" />
-  </component>
 </module>

+<?xml version="1.0" encoding="UTF-8"?>
+<module type="PYTHON_MODULE" version="4">
+  <component name="NewModuleRootManager">
+    <content url="file://$MODULE_DIR$" />
+    <orderEntry type="inheritedJdk" />
+    <orderEntry type="sourceFolder" forTests="false" />
+  </component>
 </module>

.idea/misc.xml CHANGED Viewed

@@ -1,7 +1,7 @@
-<?xml version="1.0" encoding="UTF-8"?>
-<project version="4">
-  <component name="Black">
-    <option name="sdkName" value="vlsp2023-tts-api" />
-  </component>
-  <component name="ProjectRootManager" version="2" project-jdk-name="vlsp2023-tts-api" project-jdk-type="Python SDK" />
 </project>

+<?xml version="1.0" encoding="UTF-8"?>
+<project version="4">
+  <component name="Black">
+    <option name="sdkName" value="vlsp2023-tts-api" />
+  </component>
+  <component name="ProjectRootManager" version="2" project-jdk-name="vlsp2023-tts-api" project-jdk-type="Python SDK" />
 </project>

.idea/modules.xml CHANGED Viewed

@@ -1,8 +1,8 @@
-<?xml version="1.0" encoding="UTF-8"?>
-<project version="4">
-  <component name="ProjectModuleManager">
-    <modules>
-      <module fileurl="file://$PROJECT_DIR$/.idea/kaggle-utils.iml" filepath="$PROJECT_DIR$/.idea/kaggle-utils.iml" />
-    </modules>
-  </component>
 </project>

+<?xml version="1.0" encoding="UTF-8"?>
+<project version="4">
+  <component name="ProjectModuleManager">
+    <modules>
+      <module fileurl="file://$PROJECT_DIR$/.idea/kaggle-utils.iml" filepath="$PROJECT_DIR$/.idea/kaggle-utils.iml" />
+    </modules>
+  </component>
 </project>

.idea/vcs.xml CHANGED Viewed

@@ -1,6 +1,6 @@
-<?xml version="1.0" encoding="UTF-8"?>
-<project version="4">
-  <component name="VcsDirectoryMappings">
-    <mapping directory="$PROJECT_DIR$" vcs="Git" />
-  </component>
 </project>

+<?xml version="1.0" encoding="UTF-8"?>
+<project version="4">
+  <component name="VcsDirectoryMappings">
+    <mapping directory="$PROJECT_DIR$" vcs="Git" />
+  </component>
 </project>

Dockerfile ADDED Viewed

	@@ -0,0 +1,20 @@

+FROM python:3.9
+WORKDIR /code
+COPY ./requirements.txt /code/requirements.txt
+RUN pip install --no-cache-dir --upgrade -r /code/requirements.txt
+RUN useradd -m -u 1000 user
+USER user
+ENV HOME=/home/user \
+ PATH=/home/user/.local/bin:$PATH
+WORKDIR $HOME/app
+COPY --chown=user . $HOME/app
+CMD ["uvicorn", "main:app", "--host", "0.0.0.0", "--port", "7860"]

cli.py CHANGED Viewed

@@ -1,51 +1,51 @@
-import os
-import json
-from types import SimpleNamespace
-from kaggle_service import KernelRerunService, NbJob
-import argparse
-from logger import sheet_logger
-def main(args):
-    if not os.path.exists(args.config):
-        print(f"Config folder not found: {os.path.abspath(args.config)}")
-        exit(1)
-    configs = []
-    if os.path.isdir(args.config):
-        files = os.listdir(args.config)
-        for file in files:
-            with open(os.path.join(args.config, file), "r") as f:
-                obj = json.loads(f.read())
-                configs.append(obj)
-                print(obj)
-    elif os.path.isfile(args.config):
-        with open(args.config, "r") as f:
-            obj = json.loads(f.read())
-            configs.append(obj)
-            print(obj)
-    service = KernelRerunService()
-    for config in configs:
-        service.add_job(NbJob.from_dict(config))
-    if args.option == "run":
-        service.run_all()
-    elif args.option == "validate":
-        service.validate_all()
-    elif args.option == "status":
-        service.status_all()
-    else:
-        print(f"Invalid option: {args.option}")
-if __name__ == "__main__":
-    # parser = argparse.ArgumentParser()
-    # parser.add_argument("option", type=str, default="run", choices=["run", "validate", "status"])
-    # parser.add_argument("--config", type=str, default="./config")
-    #
-    # args = parser.parse_args()
-    args = SimpleNamespace(option="validate", config='./config')
     main(args)

+import os
+import json
+from types import SimpleNamespace
+from kaggle_service import KernelRerunService, NbJob
+import argparse
+from logger import sheet_logger
+def main(args):
+    if not os.path.exists(args.config):
+        print(f"Config folder not found: {os.path.abspath(args.config)}")
+        exit(1)
+    configs = []
+    if os.path.isdir(args.config):
+        files = os.listdir(args.config)
+        for file in files:
+            with open(os.path.join(args.config, file), "r") as f:
+                obj = json.loads(f.read())
+                configs.append(obj)
+                print(obj)
+    elif os.path.isfile(args.config):
+        with open(args.config, "r") as f:
+            obj = json.loads(f.read())
+            configs.append(obj)
+            print(obj)
+    service = KernelRerunService()
+    for config in configs:
+        service.add_job(NbJob.from_dict(config))
+    if args.option == "run":
+        service.run_all()
+    elif args.option == "validate":
+        service.validate_all()
+    elif args.option == "status":
+        service.status_all()
+    else:
+        print(f"Invalid option: {args.option}")
+if __name__ == "__main__":
+    # parser = argparse.ArgumentParser()
+    # parser.add_argument("option", type=str, default="run", choices=["run", "validate", "status"])
+    # parser.add_argument("--config", type=str, default="./config")
+    #
+    # args = parser.parse_args()
+    args = SimpleNamespace(option="validate", config='./config')
     main(args)

config/aasist-train.json CHANGED Viewed

@@ -1,8 +0,0 @@
-{
-  "accounts": {
-    "hahunavth": "fb3d65ea4d06f91a83cf571e9a39d40d",
-    "mrhakk": "26780db435523a697855d5d13355744d",
-    "havthust": "c54e96568075fcc277bd10ba0e0a52b9"
-  },
-  "slug": "hahunavth/vlsp-sv-2023-aasist-train"
-}

google_sheet.py CHANGED Viewed

@@ -1,63 +1,126 @@
-import gspread
-from oauth2client.service_account import ServiceAccountCredentials
-from typing import Dict
-class SheetCRUDRepository:
-    def __init__(self, worksheet):
-        self.worksheet = worksheet
-        self.titles = self.worksheet.row_values(1)  # Assuming titles are in the first row
-        assert len(set(self.titles)) == len(self.titles), f"Failed to init {SheetCRUDRepository.__class__}, titles: {self.titles} contain duplicated values!"
-    def create(self, data: Dict):
-        values = [data.get(title, '') for title in self.titles]
-        self.worksheet.append_row(values)
-    def read(self, row_index: int) -> Dict:
-        """
-        return {} if empty
-        """
-        values = self.worksheet.row_values(row_index)
-        return {title: value for title, value in zip(self.titles, values)}
-    def update(self, row_index: int, data: Dict):
-        values = [data.get(title, '') for title in self.titles]
-        self.worksheet.update(f"A{row_index}:Z{row_index}", [values])
-    def delete(self, row_index: int):
-        self.worksheet.delete_row(row_index)
-    def find(self, search_dict):
-        for col_title, value in search_dict.items():
-            if col_title in self.titles:
-                col_index = self.titles.index(col_title) + 1  # Adding 1 to match gspread indexing
-                cell = self.worksheet.find(value, in_column=col_index)
-                if cell is None:
-                    break
-                row_number = cell.row
-                return row_number, self.read(row_number)
-        return None
-def create_repositories():
-    scope = [
-        'https://www.googleapis.com/auth/spreadsheets',
-        'https://www.googleapis.com/auth/drive'
-    ]
-    creds = ServiceAccountCredentials.from_json_keyfile_name('credentials.json', scope)
-    client = gspread.authorize(creds)
-    # sheet_url = "https://docs.google.com/spreadsheets/d/17OxKF0iP_aJJ0HCgJkwFsH762EUrtcEIYcPmyiiKnaM"
-    sheet_url = "https://docs.google.com/spreadsheets/d/1KzUYgWwbvYXGfyehOTyZCCQf0udZiwVXxaxpmkXEe3E/edit?usp=sharing"
-    sheet = client.open_by_url(sheet_url)
-    config_repository = SheetCRUDRepository(sheet.get_worksheet(0))
-    log_repository = SheetCRUDRepository(sheet.get_worksheet(1))
-    secret_repository = SheetCRUDRepository(sheet.get_worksheet(2))
-    return config_repository, log_repository, secret_repository
-conf_repo, log_repo, secret_repo = create_repositories()
-if __name__ == "__main__":
-    a = create_repositories()
     print(a)

+import gspread
+from oauth2client.service_account import ServiceAccountCredentials
+from typing import Dict
+class SheetCRUDRepository:
+    def __init__(self, worksheet):
+        self.worksheet = worksheet
+        self.titles = self.worksheet.row_values(1)  # Assuming titles are in the first row
+        assert len(set(self.titles)) == len(self.titles), f"Failed to init {SheetCRUDRepository.__class__}, titles: {self.titles} contain duplicated values!"
+    def create(self, data: Dict):
+        values = [data.get(title, '') for title in self.titles]
+        self.worksheet.append_row(values)
+    def read(self, row_index: int) -> Dict:
+        """
+        return {} if empty
+        """
+        values = self.worksheet.row_values(row_index)
+        return {title: value for title, value in zip(self.titles, values)}
+    def update(self, row_index: int, data: Dict):
+        values = [data.get(title, '') for title in self.titles]
+        self.worksheet.update(f"A{row_index}:Z{row_index}", [values])
+    def delete(self, row_index: int):
+        self.worksheet.delete_row(row_index)
+    def find(self, search_dict):
+        for col_title, value in search_dict.items():
+            if col_title in self.titles:
+                col_index = self.titles.index(col_title) + 1  # Adding 1 to match gspread indexing
+                cell = self.worksheet.find(value, in_column=col_index)
+                if cell is None:
+                    break
+                row_number = cell.row
+                return row_number, self.read(row_number)
+        return None
+class Converter:
+    @staticmethod
+    def parse_one_to_obj(field_name, value):
+        if value in ['TRUE', 'FALSE']:
+            return field_name, value == 'TRUE'
+        if isinstance(value, str):
+            if value.startswith('[DURATION]'):
+                if 'NONE' in value.upper():
+                    return field_name, None
+                value = value.replace('[DURATION]', '').replace("\n", '').rstrip()
+                sign = 1
+                if 'before' in value:
+                    sign = -1
+                if 'after' in value:
+                    sign = 1
+                value = value.replace('after', '').replace('before', '').rstrip()
+                if 'h' in value:
+                    value = value.replace('h', '')
+                    return field_name, {"hours": int(value) * sign}
+                if 'm' in value:
+                    value = value.replace('m', '')
+                    return field_name, {"minutes": int(value) * sign}
+        return field_name, value
+    @staticmethod
+    def parse_one_to_row(field_name, value):
+        if isinstance(value, str):
+            if value in ['TRUE', 'FALSE']:
+                return field_name, value == "TRUE"
+        if isinstance(value, dict):
+            if 'hours' in value or 'minutes' in value:
+                # ignore
+                return None, None
+        return field_name, value
+    @staticmethod
+    def convert_to_obj(row):
+        if row is None:
+            return None
+        obj = {}
+        for key in row.keys():
+            new_key, value = Converter.parse_one_to_obj(key, row[key])
+            if new_key is not None:
+                obj[new_key] = value
+        return obj
+    @staticmethod
+    def convert_to_row(obj):
+        if obj is None:
+            return None
+        row = {}
+        for key in obj.keys():
+            new_key, value = Converter.parse_one_to_row(key, obj[key])
+            if new_key is not None:
+                row[new_key] = value
+        return row
+def create_repositories():
+    scope = [
+        'https://www.googleapis.com/auth/spreadsheets',
+        'https://www.googleapis.com/auth/drive'
+    ]
+    creds = ServiceAccountCredentials.from_json_keyfile_name('credentials.json', scope)
+    client = gspread.authorize(creds)
+    # sheet_url = "https://docs.google.com/spreadsheets/d/17OxKF0iP_aJJ0HCgJkwFsH762EUrtcEIYcPmyiiKnaM"
+    sheet_url = "https://docs.google.com/spreadsheets/d/1KzUYgWwbvYXGfyehOTyZCCQf0udZiwVXxaxpmkXEe3E/edit?usp=sharing"
+    sheet = client.open_by_url(sheet_url)
+    run_stt_repository = SheetCRUDRepository(sheet.get_worksheet(0))
+    config_repository = SheetCRUDRepository(sheet.get_worksheet(1))
+    log_repository = SheetCRUDRepository(sheet.get_worksheet(2))
+    secret_repository = SheetCRUDRepository(sheet.get_worksheet(3))
+    return run_stt_repository, config_repository, log_repository, secret_repository
+run_stt_repo, conf_repo, log_repo, secret_repo = create_repositories()
+if __name__ == "__main__":
+    a = create_repositories()
     print(a)

kaggle_service.py CHANGED Viewed

@@ -1,583 +1,583 @@
-import json
-import os
-from typing import Callable, List, Union, Dict
-# fake default account to use kaggle.api.kaggle_api_extended
-os.environ['KAGGLE_USERNAME']=''
-os.environ['KAGGLE_KEY']=''
-from kaggle.api.kaggle_api_extended import KaggleApi
-from kaggle.rest import ApiException
-import shutil
-import time
-import threading
-import copy
-from logger import sheet_logger
-def get_api():
-    api = KaggleApi()
-    api.authenticate()
-    return api
-class KaggleApiWrapper(KaggleApi):
-    """
-    Override KaggleApi.read_config_environment to use username and secret without environment variables
-    """
-    def __init__(self, username, secret):
-        super().__init__()
-        self.username = username
-        self.secret = secret
-    def read_config_environment(self, config_data=None, quiet=False):
-        config = super().read_config_environment(config_data, quiet)
-        config['username'] = self.username
-        config['key'] = self.secret
-        # only work for pythonanyware
-        # config['proxy'] = "http://proxy.server:3128"
-        return config_data
-    def __del__(self):
-        # todo: fix bug when delete api
-        pass
-#     def get_accelerator_quota_with_http_info(self):  # noqa: E501
-#         """
-#
-#         This method makes a synchronous HTTP request by default. To make an
-#         asynchronous HTTP request, please pass async_req=True
-#         >>> thread = api.competitions_list_with_http_info(async_req=True)
-#         >>> result = thread.get()
-#
-#         :param async_req bool
-#         :param str group: Filter competitions by a particular group
-#         :param str category: Filter competitions by a particular category
-#         :param str sort_by: Sort the results
-#         :param int page: Page number
-#         :param str search: Search terms
-#         :return: Result
-#                  If the method is called asynchronously,
-#                  returns the request thread.
-#         """
-#
-#         all_params = []  # noqa: E501
-#         all_params.append('async_req')
-#         all_params.append('_return_http_data_only')
-#         all_params.append('_preload_content')
-#         all_params.append('_request_timeout')
-#
-#         params = locals()
-#
-#         collection_formats = {}
-#
-#         path_params = {}
-#
-#         query_params = []
-#         # if 'group' in params:
-#         #     query_params.append(('group', params['group']))  # noqa: E501
-#         # if 'category' in params:
-#         #     query_params.append(('category', params['category']))  # noqa: E501
-#         # if 'sort_by' in params:
-#         #     query_params.append(('sortBy', params['sort_by']))  # noqa: E501
-#         # if 'page' in params:
-#         #     query_params.append(('page', params['page']))  # noqa: E501
-#         # if 'search' in params:
-#         #     query_params.append(('search', params['search']))  # noqa: E501
-#
-#         header_params = {}
-#
-#         form_params = []
-#         local_var_files = {}
-#
-#         body_params = None
-#         # HTTP header `Accept`
-#         header_params['Accept'] = self.api_client.select_header_accept(
-#             ['application/json'])  # noqa: E501
-#
-#         # Authentication setting
-#         auth_settings = ['basicAuth']  # noqa: E501
-#
-#         return self.api_client.call_api(
-#             'i/kernels.KernelsService/GetAcceleratorQuotaStatistics', 'GET',
-#             # '/competitions/list', 'GET',
-#             path_params,
-#             query_params,
-#             header_params,
-#             body=body_params,
-#             post_params=form_params,
-#             files=local_var_files,
-#             response_type='Result',  # noqa: E501
-#             auth_settings=auth_settings,
-#             async_req=params.get('async_req'),
-#             _return_http_data_only=params.get('_return_http_data_only'),
-#             _preload_content=params.get('_preload_content', True),
-#             _request_timeout=params.get('_request_timeout'),
-#             collection_formats=collection_formats)
-#
-# if __name__ == "__main__":
-#     api = KaggleApiWrapper('[email protected]', "c54e96568075fcc277bd10ba0e0a52b9")
-#     api.authenticate()
-#     print(api.get_accelerator_quota_with_http_info())
-class ValidateException(Exception):
-    def __init__(self, message: str):
-        super(ValidateException, self).__init__(message)
-    @staticmethod
-    def from_api_exception(e: ApiException, kernel_slug: str):
-        return ValidateException(f"Error: {e.status} {e.reason} with notebook {kernel_slug}")
-    @staticmethod
-    def from_api_exception_list(el: List[ApiException], kernel_slug_list: List[str]):
-        message = f"Error: \n"
-        for e, k in zip(el, kernel_slug_list):
-            message = message + f"\t{e.status} {e.reason} with notebook {k}"
-        return ValidateException(message)
-class KaggleNotebook:
-    def __init__(self, api: KaggleApi, kernel_slug: str, container_path: str = "./tmp", id=None):
-        """
-        :param api: KaggleApi
-        :param kernel_slug: Notebook id, you can find it in the url of the notebook.
-                            For example, `username/notebook-name-123456`
-        :param container_path: Path to the local folder where the notebook will be downloaded
-        """
-        self.api = api
-        self.kernel_slug = kernel_slug
-        self.container_path = container_path
-        self.id = id
-        if self.id is None:
-            print(f"Warn: {self.__class__.__name__}.id is None")
-    def status(self) -> str or None:
-        """
-        :return:
-            "running"
-            "cancelAcknowledged"
-            "queued": waiting for run
-            "error": when raise exception in notebook
-        Throw exception when failed
-        """
-        res = self.api.kernels_status(self.kernel_slug)
-        print(f"Status: {res}")
-        if res is None:
-            if self.id is not None:
-                sheet_logger.update_job_status(self.id, notebook_status='None')
-            return None
-        if self.id is not None:
-            sheet_logger.update_job_status(self.id, notebook_status=res['status'])
-        return res['status']
-    def _get_local_nb_path(self) -> str:
-        return os.path.join(self.container_path, self.kernel_slug)
-    def pull(self, path=None) -> str or None:
-        """
-        :param path:
-        :return:
-        :raises: ApiException if notebook not found or not share to user
-        """
-        self._clean()
-        path = path or self._get_local_nb_path()
-        metadata_path = os.path.join(path, "kernel-metadata.json")
-        res = self.api.kernels_pull(self.kernel_slug, path=path, metadata=True, quiet=False)
-        if not os.path.exists(metadata_path):
-            print(f"Warn: Not found {metadata_path}. Clean {path}")
-            self._clean()
-            return None
-        return res
-    def push(self, path=None) -> str or None:
-        status = self.status()
-        if status in ['queued', 'running']:
-            print("Warn: Notebook is " + status + ". Skip push notebook!")
-            return None
-        self.api.kernels_push(path or self._get_local_nb_path())
-        time.sleep(1)
-        status = self.status()
-        return status
-    def _clean(self) -> None:
-        if os.path.exists(self._get_local_nb_path()):
-            shutil.rmtree(self._get_local_nb_path())
-    def get_metadata(self, path=None):
-        path = path or self._get_local_nb_path()
-        metadata_path = os.path.join(path, "kernel-metadata.json")
-        if not os.path.exists(metadata_path):
-            return None
-        return json.loads(open(metadata_path).read())
-    def check_nb_permission(self) -> Union[tuple[bool], tuple[bool, None]]:
-        status = self.status() # raise ApiException
-        if status is None:
-            return False, status
-        return True, status
-    def check_datasets_permission(self) -> bool:
-        meta = self.get_metadata()
-        if meta is None:
-            print("Warn: cannot get metadata. Pull and try again?")
-        dataset_sources = meta['dataset_sources']
-        ex_list = []
-        slugs = []
-        for dataset in dataset_sources:
-            try:
-                self.api.dataset_status(dataset)
-            except ApiException as e:
-                print(f"Error: {e.status} {e.reason} with dataset {dataset} in notebook {self.kernel_slug}")
-                ex_list.append(e)
-                slugs.append(self.kernel_slug)
-                # return False
-        if len(ex_list) > 0:
-            raise ValidateException.from_api_exception_list(ex_list, slugs)
-        return True
-class AccountTransactionManager:
-    def __init__(self, acc_secret_dict: dict=None):
-        """
-        :param acc_secret_dict: {username: secret}
-        """
-        self.acc_secret_dict = acc_secret_dict
-        if self.acc_secret_dict is None:
-            self.acc_secret_dict = {}
-        # self.api_dict = {username: KaggleApiWrapper(username, secret) for username, secret in acc_secret_dict.items()}
-        # lock for each account to avoid concurrent use api
-        self.lock_dict = {username: False for username in self.acc_secret_dict.keys()}
-        self.state_lock = threading.Lock()
-    def _get_api(self, username: str) -> KaggleApiWrapper:
-        # return self.api_dict[username]
-        return KaggleApiWrapper(username, self.acc_secret_dict[username])
-    def _get_lock(self, username: str) -> bool:
-        return self.lock_dict[username]
-    def _set_lock(self, username: str, lock: bool) -> None:
-        self.lock_dict[username] = lock
-    def add_account(self, username, secret):
-        if username not in self.acc_secret_dict.keys():
-            self.state_lock.acquire()
-            self.acc_secret_dict[username] = secret
-            self.lock_dict[username] = False
-            self.state_lock.release()
-    def remove_account(self, username):
-        if username in self.acc_secret_dict.keys():
-            self.state_lock.acquire()
-            del self.acc_secret_dict[username]
-            del self.lock_dict[username]
-            self.state_lock.release()
-        else:
-            print(f"Warn: try to remove account not in the list: {username}, list: {self.acc_secret_dict.keys()}")
-    def get_unlocked_api_unblocking(self, username_list: List[str]) -> tuple[KaggleApiWrapper, Callable[[], None]]:
-        """
-        :param username_list: list of username
-        :return: (api, release) where release is a function to release api
-        """
-        while True:
-            print("get_unlocked_api_unblocking" + str(username_list))
-            for username in username_list:
-                self.state_lock.acquire()
-                if not self._get_lock(username):
-                    self._set_lock(username, True)
-                    api = self._get_api(username)
-                    def release():
-                        self.state_lock.acquire()
-                        self._set_lock(username, False)
-                        api.__del__()
-                        self.state_lock.release()
-                    self.state_lock.release()
-                    return api, release
-                self.state_lock.release()
-            time.sleep(1)
-class NbJob:
-    def __init__(self, acc_dict: dict, nb_slug: str, rerun_stt: List[str] = None, not_rerun_stt: List[str] = None, id=None):
-        """
-        :param acc_dict:
-        :param nb_slug:
-        :param rerun_stt:
-        :param not_rerun_stt: If notebook status in this list, do not rerun it. (Note: do not add "queued", "running")
-        """
-        self.rerun_stt = rerun_stt
-        if self.rerun_stt is None:
-            self.rerun_stt = ['complete']
-        self.not_rerun_stt = not_rerun_stt
-        if self.not_rerun_stt is None:
-            self.not_rerun_stt = ['queued', 'running', 'cancelAcknowledged']
-        assert "queued" in self.not_rerun_stt
-        assert "running" in self.not_rerun_stt
-        self.acc_dict = acc_dict
-        self.nb_slug = nb_slug
-        self.id = id
-    def get_acc_dict(self):
-        return self.acc_dict
-    def get_username_list(self):
-        return list(self.acc_dict.keys())
-    def is_valid_with_acc(self, api):
-        """
-        :param api:
-        :return:
-        :raise: ValidationException
-        """
-        notebook = KaggleNotebook(api, self.nb_slug, id=self.id)
-        try:
-            notebook.pull()  # raise ApiException
-            stt, _ = notebook.check_nb_permission()  # note: raise ApiException
-            stt = notebook.check_datasets_permission()  # raise ValidationException
-        except ApiException as e:
-            raise ValidateException.from_api_exception(e, self.nb_slug)
-        # if not stt:
-        #     return False
-        return True
-    def is_valid(self):
-        for username in self.acc_dict.keys():
-            secrets = self.acc_dict[username]
-            api = KaggleApiWrapper(username=username, secret=secrets)
-            api.authenticate()
-            if not self.is_valid_with_acc(api):
-                return False
-        return True
-    def acc_check_and_rerun_if_need(self, api: KaggleApi) -> bool:
-        """
-        :return:
-            True if rerun success or notebook is running
-            False user does not have enough gpu quotas
-        :raises
-            Exception if setup error
-        """
-        notebook = KaggleNotebook(api, self.nb_slug, "./tmp", id=self.id)  # todo: change hardcode container_path here
-        notebook.pull()
-        assert notebook.check_datasets_permission(), f"User {api} does not have permission on datasets of notebook {self.nb_slug}"
-        success, status1 = notebook.check_nb_permission()
-        assert success, f"User {api} does not have permission on notebook {self.nb_slug}"  # todo: using api.username
-        if status1 in self.rerun_stt:
-            status2 = notebook.push()
-            time.sleep(10)
-            status3 = notebook.status()
-            # if 3 times same stt -> acc out of quota
-            if status1 == status2 == status3:
-                sheet_logger.log(username=api.username, nb=self.nb_slug, log="Try but no effect. Seem account to be out of quota")
-                return False
-            if status3 in self.not_rerun_stt:
-                # sheet_logger.log(username=api.username, nb=self.nb_slug, log=f"Notebook status is {status3} is in ignore status list {self.not_rerun_stt}, do nothing!")
-                sheet_logger.log(username=api.username, nb=self.nb_slug,
-                                 log=f"Schedule notebook successfully. Current status is '{status3}'")
-                return True
-            if status3 not in ["queued", "running"]:
-                # return False # todo: check when user is out of quota
-                print(f"Error: status is {status3}")
-                raise Exception("Setup exception")
-            return True
-        sheet_logger.log(username=api.username, nb=self.nb_slug, log=f"Notebook status is '{status1}' is not in {self.rerun_stt}, do nothing!")
-        return True
-    @staticmethod
-    def from_dict(obj: dict, id=None):
-        return NbJob(acc_dict=obj['accounts'], nb_slug=obj['slug'], rerun_stt=obj.get('rerun_status'), not_rerun_stt=obj.get('not_rerun_stt'), id=id)
-class KernelRerunService:
-    def __init__(self):
-        self.jobs: Dict[str, NbJob] = {}
-        self.acc_manager = AccountTransactionManager()
-        self.username2jobid = {}
-        self.jobid2username = {}
-    def add_job(self, nb_job: NbJob):
-        if nb_job.nb_slug in self.jobs.keys():
-            print("Warn: nb_job already in job list")
-            return
-        self.jobs[nb_job.nb_slug] = nb_job
-        self.jobid2username[nb_job.nb_slug] = nb_job.get_username_list()
-        for username in nb_job.get_username_list():
-            if username not in self.username2jobid.keys():
-                self.username2jobid[username] = []
-                self.acc_manager.add_account(username, nb_job.acc_dict[username])
-            self.username2jobid[username].append(nb_job.nb_slug)
-    def remove_job(self, nb_job):
-        if nb_job.nb_slug not in self.jobs.keys():
-            print("Warn: try to remove nb_job not in list")
-            return
-        username_list = self.jobid2username[nb_job.nb_slug]
-        username_list = [username for username in username_list if len(self.username2jobid[username]) == 1]
-        for username in username_list:
-            del self.username2jobid[username]
-            self.acc_manager.remove_account(username)
-        del self.jobs[nb_job.nb_slug]
-        del self.jobid2username[nb_job.nb_slug]
-    def validate_all(self):
-        for username in self.acc_manager.acc_secret_dict.keys():
-            api, release = self.acc_manager.get_unlocked_api_unblocking([username])
-            api.authenticate()
-            print(f"Using username: {api.username}")
-            for job in self.jobs.values():
-                ex_msg_list = []
-                if username in job.get_username_list():
-                    print(f"Validate user: {username}, job: {job.nb_slug}")
-                    try:
-                        job.is_valid_with_acc(api)
-                    except ValidateException as e:
-                        print(f"Error: not valid")
-                        a = f"Setup error: {username} does not have permission on notebook {job.nb_slug} or related datasets"
-                        if job.id is not None: # if have id, write log
-                            ex_msg_list.append(f"Account {username}\n" + str(e) + "\n")
-                        else: # if not have id, raise
-                            raise Exception(a)
-                if len(ex_msg_list) > 0:
-                    sheet_logger.update_job_status(job.id, validate_status="\n".join(ex_msg_list))
-                else:
-                    sheet_logger.update_job_status(job.id, validate_status="success")
-            release()
-        return True
-    def status_all(self):
-        for job in self.jobs.values():
-            print(f"Job: {job.nb_slug}")
-            api, release = self.acc_manager.get_unlocked_api_unblocking(job.get_username_list())
-            api.authenticate()
-            print(f"Using username: {api.username}")
-            notebook = KaggleNotebook(api, job.nb_slug, id=job.id)
-            print(f"Notebook: {notebook.kernel_slug}")
-            print(notebook.status())
-            release()
-    def run(self, nb_job: NbJob):
-        username_list = copy.copy(nb_job.get_username_list())
-        while len(username_list) > 0:
-            api, release = self.acc_manager.get_unlocked_api_unblocking(username_list)
-            api.authenticate()
-            print(f"Using username: {api.username}")
-            try:
-                result = nb_job.acc_check_and_rerun_if_need(api)
-                if result:
-                    return True
-            except Exception as e:
-                print(e)
-                release()
-                break
-            if api.username in username_list:
-                username_list.remove(api.username)
-                release()
-            else:
-                release()
-                raise Exception("")
-        return False
-    def run_all(self):
-        for job in self.jobs.values():
-            success = self.run(job)
-            print(f"Job: {job.nb_slug} {success}")
-# if __name__ == "__main__":
-    # service = KernelRerunService()
-    # files = os.listdir("./config")
-    # for file in files:
-    #     if '.example' not in file:
-    #         with open(os.path.join("./config", file), "r") as f:
-    #             obj = json.loads(f.read())
-    #             print(obj)
-    #             service.add_job(NbJob.from_dict(obj))
-    # service.run_all()
-    # try:
-    #     acc_secret_dict = {
-    #         "hahunavth": "secret",
-    #         "hahunavth2": "secret",
-    #         "hahunavth3": "secret",
-    #         "hahunavth4": "secret",
-    #         "hahunavth5": "secret",
-    #     }
-    #     acc_manager = AccountTransactionManager(acc_secret_dict)
-    #
-    #
-    #     def test1():
-    #         username_list = ["hahunavth", "hahunavth2", "hahunavth3", "hahunavth4", "hahunavth5"]
-    #         while len(username_list) > 0:
-    #             api, release = acc_manager.get_unlocked_api_unblocking(username_list)
-    #             print("test1 is using " + api.username)
-    #             time.sleep(1)
-    #             release()
-    #             if api.username in username_list:
-    #                 username_list.remove(api.username)
-    #             else:
-    #                 raise Exception("")
-    #             print("test1 release " + api.username)
-    #
-    #
-    #     def test2():
-    #         username_list = ["hahunavth2", "hahunavth3", "hahunavth5"]
-    #         while len(username_list) > 0:
-    #             api, release = acc_manager.get_unlocked_api_unblocking(username_list)
-    #             print("test2 is using " + api.username)
-    #             time.sleep(3)
-    #             release()
-    #             if api.username in username_list:
-    #                 username_list.remove(api.username)
-    #             else:
-    #                 raise Exception("")
-    #             print("test2 release " + api.username)
-    #
-    #
-    #     t1 = threading.Thread(target=test1)
-    #     t2 = threading.Thread(target=test2)
-    #     t1.start()
-    #     t2.start()
-    #     t1.join()
-    #     t2.join()
-    #
-    #     # kgapi = KaggleApiWrapper("hahunavth", "fb3d65ea4d06f91a83cf571e9a39d40d")
-    #     # kgapi.authenticate()
-    #     # # kgapi = get_api()
-    #     # notebook = KaggleNotebook(kgapi, "hahunavth/ess-vlsp2023-denoising", "./tmp")
-    #     # # print(notebook.pull())
-    #     # # print(notebook.check_datasets_permission())
-    #     # print(notebook.check_nb_permission())
-    #     # # print(notebook.status())
-    #     # # notebook.push()
-    #     # # print(notebook.status())
-    # except ApiException as e:
-    #     print(e.status)
-    #     print(e.reason)
-    #     raise e
-    #     # 403 when nb not exists or not share to acc
-    #     # 404 when push to unknow kenel_slug.username
     #     # 401 when invalid username, pass

+import json
+import os
+from typing import Callable, List, Union, Dict
+# fake default account to use kaggle.api.kaggle_api_extended
+os.environ['KAGGLE_USERNAME']=''
+os.environ['KAGGLE_KEY']=''
+from kaggle.api.kaggle_api_extended import KaggleApi
+from kaggle.rest import ApiException
+import shutil
+import time
+import threading
+import copy
+from logger import sheet_logger
+def get_api():
+    api = KaggleApi()
+    api.authenticate()
+    return api
+class KaggleApiWrapper(KaggleApi):
+    """
+    Override KaggleApi.read_config_environment to use username and secret without environment variables
+    """
+    def __init__(self, username, secret):
+        super().__init__()
+        self.username = username
+        self.secret = secret
+    def read_config_environment(self, config_data=None, quiet=False):
+        config = super().read_config_environment(config_data, quiet)
+        config['username'] = self.username
+        config['key'] = self.secret
+        # only work for pythonanyware
+        # config['proxy'] = "http://proxy.server:3128"
+        return config_data
+    def __del__(self):
+        # todo: fix bug when delete api
+        pass
+#     def get_accelerator_quota_with_http_info(self):  # noqa: E501
+#         """
+#
+#         This method makes a synchronous HTTP request by default. To make an
+#         asynchronous HTTP request, please pass async_req=True
+#         >>> thread = api.competitions_list_with_http_info(async_req=True)
+#         >>> result = thread.get()
+#
+#         :param async_req bool
+#         :param str group: Filter competitions by a particular group
+#         :param str category: Filter competitions by a particular category
+#         :param str sort_by: Sort the results
+#         :param int page: Page number
+#         :param str search: Search terms
+#         :return: Result
+#                  If the method is called asynchronously,
+#                  returns the request thread.
+#         """
+#
+#         all_params = []  # noqa: E501
+#         all_params.append('async_req')
+#         all_params.append('_return_http_data_only')
+#         all_params.append('_preload_content')
+#         all_params.append('_request_timeout')
+#
+#         params = locals()
+#
+#         collection_formats = {}
+#
+#         path_params = {}
+#
+#         query_params = []
+#         # if 'group' in params:
+#         #     query_params.append(('group', params['group']))  # noqa: E501
+#         # if 'category' in params:
+#         #     query_params.append(('category', params['category']))  # noqa: E501
+#         # if 'sort_by' in params:
+#         #     query_params.append(('sortBy', params['sort_by']))  # noqa: E501
+#         # if 'page' in params:
+#         #     query_params.append(('page', params['page']))  # noqa: E501
+#         # if 'search' in params:
+#         #     query_params.append(('search', params['search']))  # noqa: E501
+#
+#         header_params = {}
+#
+#         form_params = []
+#         local_var_files = {}
+#
+#         body_params = None
+#         # HTTP header `Accept`
+#         header_params['Accept'] = self.api_client.select_header_accept(
+#             ['application/json'])  # noqa: E501
+#
+#         # Authentication setting
+#         auth_settings = ['basicAuth']  # noqa: E501
+#
+#         return self.api_client.call_api(
+#             'i/kernels.KernelsService/GetAcceleratorQuotaStatistics', 'GET',
+#             # '/competitions/list', 'GET',
+#             path_params,
+#             query_params,
+#             header_params,
+#             body=body_params,
+#             post_params=form_params,
+#             files=local_var_files,
+#             response_type='Result',  # noqa: E501
+#             auth_settings=auth_settings,
+#             async_req=params.get('async_req'),
+#             _return_http_data_only=params.get('_return_http_data_only'),
+#             _preload_content=params.get('_preload_content', True),
+#             _request_timeout=params.get('_request_timeout'),
+#             collection_formats=collection_formats)
+#
+# if __name__ == "__main__":
+#     api = KaggleApiWrapper('[email protected]', "c54e96568075fcc277bd10ba0e0a52b9")
+#     api.authenticate()
+#     print(api.get_accelerator_quota_with_http_info())
+class ValidateException(Exception):
+    def __init__(self, message: str):
+        super(ValidateException, self).__init__(message)
+    @staticmethod
+    def from_api_exception(e: ApiException, kernel_slug: str):
+        return ValidateException(f"Error: {e.status} {e.reason} with notebook {kernel_slug}")
+    @staticmethod
+    def from_api_exception_list(el: List[ApiException], kernel_slug_list: List[str]):
+        message = f"Error: \n"
+        for e, k in zip(el, kernel_slug_list):
+            message = message + f"\t{e.status} {e.reason} with notebook {k}"
+        return ValidateException(message)
+class KaggleNotebook:
+    def __init__(self, api: KaggleApi, kernel_slug: str, container_path: str = "./tmp", id=None):
+        """
+        :param api: KaggleApi
+        :param kernel_slug: Notebook id, you can find it in the url of the notebook.
+                            For example, `username/notebook-name-123456`
+        :param container_path: Path to the local folder where the notebook will be downloaded
+        """
+        self.api = api
+        self.kernel_slug = kernel_slug
+        self.container_path = container_path
+        self.id = id
+        if self.id is None:
+            print(f"Warn: {self.__class__.__name__}.id is None")
+    def status(self) -> str or None:
+        """
+        :return:
+            "running"
+            "cancelAcknowledged"
+            "queued": waiting for run
+            "error": when raise exception in notebook
+        Throw exception when failed
+        """
+        res = self.api.kernels_status(self.kernel_slug)
+        print(f"Status: {res}")
+        if res is None:
+            if self.id is not None:
+                sheet_logger.update_job_status(self.id, notebook_status='None')
+            return None
+        if self.id is not None:
+            sheet_logger.update_job_status(self.id, notebook_status=res['status'])
+        return res['status']
+    def _get_local_nb_path(self) -> str:
+        return os.path.join(self.container_path, self.kernel_slug)
+    def pull(self, path=None) -> str or None:
+        """
+        :param path:
+        :return:
+        :raises: ApiException if notebook not found or not share to user
+        """
+        self._clean()
+        path = path or self._get_local_nb_path()
+        metadata_path = os.path.join(path, "kernel-metadata.json")
+        res = self.api.kernels_pull(self.kernel_slug, path=path, metadata=True, quiet=False)
+        if not os.path.exists(metadata_path):
+            print(f"Warn: Not found {metadata_path}. Clean {path}")
+            self._clean()
+            return None
+        return res
+    def push(self, path=None) -> str or None:
+        status = self.status()
+        if status in ['queued', 'running']:
+            print("Warn: Notebook is " + status + ". Skip push notebook!")
+            return None
+        self.api.kernels_push(path or self._get_local_nb_path())
+        time.sleep(1)
+        status = self.status()
+        return status
+    def _clean(self) -> None:
+        if os.path.exists(self._get_local_nb_path()):
+            shutil.rmtree(self._get_local_nb_path())
+    def get_metadata(self, path=None):
+        path = path or self._get_local_nb_path()
+        metadata_path = os.path.join(path, "kernel-metadata.json")
+        if not os.path.exists(metadata_path):
+            return None
+        return json.loads(open(metadata_path).read())
+    def check_nb_permission(self) -> Union[tuple[bool], tuple[bool, None]]:
+        status = self.status() # raise ApiException
+        if status is None:
+            return False, status
+        return True, status
+    def check_datasets_permission(self) -> bool:
+        meta = self.get_metadata()
+        if meta is None:
+            print("Warn: cannot get metadata. Pull and try again?")
+        dataset_sources = meta['dataset_sources']
+        ex_list = []
+        slugs = []
+        for dataset in dataset_sources:
+            try:
+                self.api.dataset_status(dataset)
+            except ApiException as e:
+                print(f"Error: {e.status} {e.reason} with dataset {dataset} in notebook {self.kernel_slug}")
+                ex_list.append(e)
+                slugs.append(self.kernel_slug)
+                # return False
+        if len(ex_list) > 0:
+            raise ValidateException.from_api_exception_list(ex_list, slugs)
+        return True
+class AccountTransactionManager:
+    def __init__(self, acc_secret_dict: dict=None):
+        """
+        :param acc_secret_dict: {username: secret}
+        """
+        self.acc_secret_dict = acc_secret_dict
+        if self.acc_secret_dict is None:
+            self.acc_secret_dict = {}
+        # self.api_dict = {username: KaggleApiWrapper(username, secret) for username, secret in acc_secret_dict.items()}
+        # lock for each account to avoid concurrent use api
+        self.lock_dict = {username: False for username in self.acc_secret_dict.keys()}
+        self.state_lock = threading.Lock()
+    def _get_api(self, username: str) -> KaggleApiWrapper:
+        # return self.api_dict[username]
+        return KaggleApiWrapper(username, self.acc_secret_dict[username])
+    def _get_lock(self, username: str) -> bool:
+        return self.lock_dict[username]
+    def _set_lock(self, username: str, lock: bool) -> None:
+        self.lock_dict[username] = lock
+    def add_account(self, username, secret):
+        if username not in self.acc_secret_dict.keys():
+            self.state_lock.acquire()
+            self.acc_secret_dict[username] = secret
+            self.lock_dict[username] = False
+            self.state_lock.release()
+    def remove_account(self, username):
+        if username in self.acc_secret_dict.keys():
+            self.state_lock.acquire()
+            del self.acc_secret_dict[username]
+            del self.lock_dict[username]
+            self.state_lock.release()
+        else:
+            print(f"Warn: try to remove account not in the list: {username}, list: {self.acc_secret_dict.keys()}")
+    def get_unlocked_api_unblocking(self, username_list: List[str]) -> tuple[KaggleApiWrapper, Callable[[], None]]:
+        """
+        :param username_list: list of username
+        :return: (api, release) where release is a function to release api
+        """
+        while True:
+            print("get_unlocked_api_unblocking" + str(username_list))
+            for username in username_list:
+                self.state_lock.acquire()
+                if not self._get_lock(username):
+                    self._set_lock(username, True)
+                    api = self._get_api(username)
+                    def release():
+                        self.state_lock.acquire()
+                        self._set_lock(username, False)
+                        api.__del__()
+                        self.state_lock.release()
+                    self.state_lock.release()
+                    return api, release
+                self.state_lock.release()
+            time.sleep(1)
+class NbJob:
+    def __init__(self, acc_dict: dict, nb_slug: str, rerun_stt: List[str] = None, not_rerun_stt: List[str] = None, id=None):
+        """
+        :param acc_dict:
+        :param nb_slug:
+        :param rerun_stt:
+        :param not_rerun_stt: If notebook status in this list, do not rerun it. (Note: do not add "queued", "running")
+        """
+        self.rerun_stt = rerun_stt
+        if self.rerun_stt is None:
+            self.rerun_stt = ['complete']
+        self.not_rerun_stt = not_rerun_stt
+        if self.not_rerun_stt is None:
+            self.not_rerun_stt = ['queued', 'running', 'cancelAcknowledged']
+        assert "queued" in self.not_rerun_stt
+        assert "running" in self.not_rerun_stt
+        self.acc_dict = acc_dict
+        self.nb_slug = nb_slug
+        self.id = id
+    def get_acc_dict(self):
+        return self.acc_dict
+    def get_username_list(self):
+        return list(self.acc_dict.keys())
+    def is_valid_with_acc(self, api):
+        """
+        :param api:
+        :return:
+        :raise: ValidationException
+        """
+        notebook = KaggleNotebook(api, self.nb_slug, id=self.id)
+        try:
+            notebook.pull()  # raise ApiException
+            stt, _ = notebook.check_nb_permission()  # note: raise ApiException
+            stt = notebook.check_datasets_permission()  # raise ValidationException
+        except ApiException as e:
+            raise ValidateException.from_api_exception(e, self.nb_slug)
+        # if not stt:
+        #     return False
+        return True
+    def is_valid(self):
+        for username in self.acc_dict.keys():
+            secrets = self.acc_dict[username]
+            api = KaggleApiWrapper(username=username, secret=secrets)
+            api.authenticate()
+            if not self.is_valid_with_acc(api):
+                return False
+        return True
+    def acc_check_and_rerun_if_need(self, api: KaggleApi) -> bool:
+        """
+        :return:
+            True if rerun success or notebook is running
+            False user does not have enough gpu quotas
+        :raises
+            Exception if setup error
+        """
+        notebook = KaggleNotebook(api, self.nb_slug, "./tmp", id=self.id)  # todo: change hardcode container_path here
+        notebook.pull()
+        assert notebook.check_datasets_permission(), f"User {api} does not have permission on datasets of notebook {self.nb_slug}"
+        success, status1 = notebook.check_nb_permission()
+        assert success, f"User {api} does not have permission on notebook {self.nb_slug}"  # todo: using api.username
+        if status1 in self.rerun_stt:
+            status2 = notebook.push()
+            time.sleep(10)
+            status3 = notebook.status()
+            # if 3 times same stt -> acc out of quota
+            if status1 == status2 == status3:
+                sheet_logger.log(username=api.username, nb=self.nb_slug, log="Try but no effect. Seem account to be out of quota")
+                return False
+            if status3 in self.not_rerun_stt:
+                # sheet_logger.log(username=api.username, nb=self.nb_slug, log=f"Notebook status is {status3} is in ignore status list {self.not_rerun_stt}, do nothing!")
+                sheet_logger.log(username=api.username, nb=self.nb_slug,
+                                 log=f"Schedule notebook successfully. Current status is '{status3}'")
+                return True
+            if status3 not in ["queued", "running"]:
+                # return False # todo: check when user is out of quota
+                print(f"Error: status is {status3}")
+                raise Exception("Setup exception")
+            return True
+        sheet_logger.log(username=api.username, nb=self.nb_slug, log=f"Notebook status is '{status1}' is not in {self.rerun_stt}, do nothing!")
+        return True
+    @staticmethod
+    def from_dict(obj: dict, id=None):
+        return NbJob(acc_dict=obj['accounts'], nb_slug=obj['slug'], rerun_stt=obj.get('rerun_status'), not_rerun_stt=obj.get('not_rerun_stt'), id=id)
+class KernelRerunService:
+    def __init__(self):
+        self.jobs: Dict[str, NbJob] = {}
+        self.acc_manager = AccountTransactionManager()
+        self.username2jobid = {}
+        self.jobid2username = {}
+    def add_job(self, nb_job: NbJob):
+        if nb_job.nb_slug in self.jobs.keys():
+            print("Warn: nb_job already in job list")
+            return
+        self.jobs[nb_job.nb_slug] = nb_job
+        self.jobid2username[nb_job.nb_slug] = nb_job.get_username_list()
+        for username in nb_job.get_username_list():
+            if username not in self.username2jobid.keys():
+                self.username2jobid[username] = []
+                self.acc_manager.add_account(username, nb_job.acc_dict[username])
+            self.username2jobid[username].append(nb_job.nb_slug)
+    def remove_job(self, nb_job):
+        if nb_job.nb_slug not in self.jobs.keys():
+            print("Warn: try to remove nb_job not in list")
+            return
+        username_list = self.jobid2username[nb_job.nb_slug]
+        username_list = [username for username in username_list if len(self.username2jobid[username]) == 1]
+        for username in username_list:
+            del self.username2jobid[username]
+            self.acc_manager.remove_account(username)
+        del self.jobs[nb_job.nb_slug]
+        del self.jobid2username[nb_job.nb_slug]
+    def validate_all(self):
+        for username in self.acc_manager.acc_secret_dict.keys():
+            api, release = self.acc_manager.get_unlocked_api_unblocking([username])
+            api.authenticate()
+            print(f"Using username: {api.username}")
+            for job in self.jobs.values():
+                ex_msg_list = []
+                if username in job.get_username_list():
+                    print(f"Validate user: {username}, job: {job.nb_slug}")
+                    try:
+                        job.is_valid_with_acc(api)
+                    except ValidateException as e:
+                        print(f"Error: not valid")
+                        a = f"Setup error: {username} does not have permission on notebook {job.nb_slug} or related datasets"
+                        if job.id is not None: # if have id, write log
+                            ex_msg_list.append(f"Account {username}\n" + str(e) + "\n")
+                        else: # if not have id, raise
+                            raise Exception(a)
+                if len(ex_msg_list) > 0:
+                    sheet_logger.update_job_status(job.id, validate_status="\n".join(ex_msg_list))
+                else:
+                    sheet_logger.update_job_status(job.id, validate_status="success")
+            release()
+        return True
+    def status_all(self):
+        for job in self.jobs.values():
+            print(f"Job: {job.nb_slug}")
+            api, release = self.acc_manager.get_unlocked_api_unblocking(job.get_username_list())
+            api.authenticate()
+            print(f"Using username: {api.username}")
+            notebook = KaggleNotebook(api, job.nb_slug, id=job.id)
+            print(f"Notebook: {notebook.kernel_slug}")
+            print(notebook.status())
+            release()
+    def run(self, nb_job: NbJob):
+        username_list = copy.copy(nb_job.get_username_list())
+        while len(username_list) > 0:
+            api, release = self.acc_manager.get_unlocked_api_unblocking(username_list)
+            api.authenticate()
+            print(f"Using username: {api.username}")
+            try:
+                result = nb_job.acc_check_and_rerun_if_need(api)
+                if result:
+                    return True
+            except Exception as e:
+                print(e)
+                release()
+                break
+            if api.username in username_list:
+                username_list.remove(api.username)
+                release()
+            else:
+                release()
+                raise Exception("")
+        return False
+    def run_all(self):
+        for job in self.jobs.values():
+            success = self.run(job)
+            print(f"Job: {job.nb_slug} {success}")
+# if __name__ == "__main__":
+    # service = KernelRerunService()
+    # files = os.listdir("./config")
+    # for file in files:
+    #     if '.example' not in file:
+    #         with open(os.path.join("./config", file), "r") as f:
+    #             obj = json.loads(f.read())
+    #             print(obj)
+    #             service.add_job(NbJob.from_dict(obj))
+    # service.run_all()
+    # try:
+    #     acc_secret_dict = {
+    #         "hahunavth": "secret",
+    #         "hahunavth2": "secret",
+    #         "hahunavth3": "secret",
+    #         "hahunavth4": "secret",
+    #         "hahunavth5": "secret",
+    #     }
+    #     acc_manager = AccountTransactionManager(acc_secret_dict)
+    #
+    #
+    #     def test1():
+    #         username_list = ["hahunavth", "hahunavth2", "hahunavth3", "hahunavth4", "hahunavth5"]
+    #         while len(username_list) > 0:
+    #             api, release = acc_manager.get_unlocked_api_unblocking(username_list)
+    #             print("test1 is using " + api.username)
+    #             time.sleep(1)
+    #             release()
+    #             if api.username in username_list:
+    #                 username_list.remove(api.username)
+    #             else:
+    #                 raise Exception("")
+    #             print("test1 release " + api.username)
+    #
+    #
+    #     def test2():
+    #         username_list = ["hahunavth2", "hahunavth3", "hahunavth5"]
+    #         while len(username_list) > 0:
+    #             api, release = acc_manager.get_unlocked_api_unblocking(username_list)
+    #             print("test2 is using " + api.username)
+    #             time.sleep(3)
+    #             release()
+    #             if api.username in username_list:
+    #                 username_list.remove(api.username)
+    #             else:
+    #                 raise Exception("")
+    #             print("test2 release " + api.username)
+    #
+    #
+    #     t1 = threading.Thread(target=test1)
+    #     t2 = threading.Thread(target=test2)
+    #     t1.start()
+    #     t2.start()
+    #     t1.join()
+    #     t2.join()
+    #
+    #     # kgapi = KaggleApiWrapper("hahunavth", "fb3d65ea4d06f91a83cf571e9a39d40d")
+    #     # kgapi.authenticate()
+    #     # # kgapi = get_api()
+    #     # notebook = KaggleNotebook(kgapi, "hahunavth/ess-vlsp2023-denoising", "./tmp")
+    #     # # print(notebook.pull())
+    #     # # print(notebook.check_datasets_permission())
+    #     # print(notebook.check_nb_permission())
+    #     # # print(notebook.status())
+    #     # # notebook.push()
+    #     # # print(notebook.status())
+    # except ApiException as e:
+    #     print(e.status)
+    #     print(e.reason)
+    #     raise e
+    #     # 403 when nb not exists or not share to acc
+    #     # 404 when push to unknow kenel_slug.username
     #     # 401 when invalid username, pass

logger.py CHANGED Viewed

@@ -1,53 +1,59 @@
-import platform,socket,re,uuid,json,psutil,logging
-from datetime import datetime as dt
-from google_sheet import log_repo, conf_repo, SheetCRUDRepository
-from version import VERSION
-def get_sys_info():
-    try:
-        info={}
-        info['platform']=platform.system()
-        info['platform-release']=platform.release()
-        info['platform-version']=platform.version()
-        info['architecture']=platform.machine()
-        info['hostname']=socket.gethostname()
-        info['ip-address']=socket.gethostbyname(socket.gethostname())
-        info['mac-address']=':'.join(re.findall('..', '%012x' % uuid.getnode()))
-        info['processor']=platform.processor()
-        info['ram']=str(round(psutil.virtual_memory().total / (1024.0 **3)))+" GB"
-        return json.dumps(info)
-    except Exception as e:
-        logging.exception(e)
-class SheetLogger:
-    def __init__(self, log_repo: SheetCRUDRepository, config_repo: SheetCRUDRepository):
-        self.log_repo = log_repo
-        self.config_repo = config_repo
-    def log(self, log='', nb='', username=''):
-        self.log_repo.create({
-            "time": str(dt.now()),
-            "notebook_name": nb,
-            "kaggle_username": username,
-            "log": log,
-            "device": str(get_sys_info()),
-            "version": VERSION
-        })
-    def update_job_status(self, row, validate_status: str = None, notebook_status: str = None):
-        data = self.config_repo.read(row)
-        data.update({"last_updated": str(dt.now())})
-        if validate_status is not None:
-            data.update({"validate_status": validate_status})
-        if notebook_status is not None:
-            data.update({"notebook_status": notebook_status})
-        self.config_repo.update(row, data)
-        # print(self.config_repo.find({"config": "hahunavth/vlsp-sv-2023-s2pecnet-train"}))
-sheet_logger = SheetLogger(log_repo, conf_repo)
-if __name__ == "__main__":
     sheet_logger.update_job_status(5, "abc" , )

+import platform,socket,re,uuid,json,psutil,logging
+from datetime import datetime as dt
+from google_sheet import log_repo, conf_repo, SheetCRUDRepository
+from version import VERSION
+import pytz
+def get_now():
+    current_time = dt.now(pytz.timezone('Asia/Ho_Chi_Minh'))
+    return current_time
+def get_sys_info():
+    try:
+        info={}
+        info['platform']=platform.system()
+        info['platform-release']=platform.release()
+        info['platform-version']=platform.version()
+        info['architecture']=platform.machine()
+        info['hostname']=socket.gethostname()
+        info['ip-address']=socket.gethostbyname(socket.gethostname())
+        info['mac-address']=':'.join(re.findall('..', '%012x' % uuid.getnode()))
+        info['processor']=platform.processor()
+        info['ram']=str(round(psutil.virtual_memory().total / (1024.0 **3)))+" GB"
+        return json.dumps(info)
+    except Exception as e:
+        logging.exception(e)
+class SheetLogger:
+    def __init__(self, log_repo: SheetCRUDRepository, config_repo: SheetCRUDRepository):
+        self.log_repo = log_repo
+        self.config_repo = config_repo
+    def log(self, log='', nb='', username=''):
+        self.log_repo.create({
+            "time": str(get_now()),
+            "notebook_name": nb,
+            "kaggle_username": username,
+            "log": log,
+            "device": str(get_sys_info()),
+            "version": VERSION
+        })
+    def update_job_status(self, row, validate_status: str = None, notebook_status: str = None):
+        data = self.config_repo.read(row)
+        data.update({"last_updated": str(get_now())})
+        if validate_status is not None:
+            data.update({"validate_status": validate_status})
+        if notebook_status is not None:
+            data.update({"notebook_status": notebook_status})
+        self.config_repo.update(row, data)
+        # print(self.config_repo.find({"config": "hahunavth/vlsp-sv-2023-s2pecnet-train"}))
+sheet_logger = SheetLogger(log_repo, conf_repo)
+if __name__ == "__main__":
     sheet_logger.update_job_status(5, "abc" , )

main.py CHANGED Viewed

@@ -1,99 +1,109 @@
-from google_sheet import conf_repo, secret_repo
-import json
-from kaggle_service import KernelRerunService, NbJob
-from logger import sheet_logger
-if __name__ == "__main__":
-    sheet_logger.log("========= start ==========")
-    # load all account and secret into a dict
-    secret_dict = {}
-    try:
-        for i in range(2, 50):  # note: read row 2 - 50
-            rs = secret_repo.read(i)
-            if not rs:
-                break
-            assert 'username' in rs
-            assert 'secret' in rs
-            username = rs['username'].rstrip()
-            secret = rs['secret'].rstrip()
-            secret_dict[username] = secret
-    except Exception as e:
-        sheet_logger.log(log="Get secret table failed!!" + str(e))
-    # load config from gg sheet file
-    configs = []
-    ids = []
-    try:
-        for i in range(2, 50):     # note: read row 2 - 50
-            rs = conf_repo.read(i)
-            if not rs:
-                break
-            if not rs['config']:
-                reset_keys = []
-                for key in rs:
-                    if rs[key]:
-                        reset_keys.append(key)
-                if len(reset_keys) > 0:
-                    conf_repo.update(row_index=i, data={k: '' for k in reset_keys})
-                break
-            print(i, rs)
-            try:
-                # validation
-                # assert 'config' in rs, 'require config column'
-                assert 'usernames' in rs, 'require usernames column'
-                assert 'enable' in rs, 'require enable column'
-                assert rs['enable'].rstrip() in ['enable', 'disable'], rs['enable']
-                assert 'slug' in rs['config'], 'require config.slug'
-                cfg = json.loads(rs['config'])
-                usernames = set(rs['usernames']
-                             .rstrip().replace('\n', ' ').replace(',', ' ').replace(';', ' ').replace('|', ' ')
-                             .split(' '))
-                usernames = [u for u in usernames if u]
-                is_enabled = rs['enable'].rstrip() == 'enable'
-                if not is_enabled:
-                    sheet_logger.log(log="Disabled, skip!", nb=cfg['slug'])
-                    print("skip ", cfg['slug'])
-                    continue
-                assert len(usernames) > 0, 'len usernames == 0'
-                # process config
-                accounts = {u: secret_dict[u] for u in secret_dict if u in usernames}
-                assert not set(usernames).difference(set(accounts.keys())), set(usernames).difference(set(accounts.keys()))
-                cfg = {**cfg, "accounts": accounts}
-                # save
-                configs.append(cfg)
-                ids.append(i)
-                print(cfg)
-            except AssertionError:
-                import traceback
-                sheet_logger.update_job_status(i, validate_status=str(traceback.format_exc()))
-    except Exception:
-        import traceback
-        sheet_logger.log(log="Get config failed!!" + str(traceback.format_exc()))
-    # add config to service
-    service = KernelRerunService()
-    for config, idx in zip(configs, ids):
-        try:
-            service.add_job(NbJob.from_dict(config, id=idx))
-        except Exception as e:
-            sheet_logger.update_job_status(idx, validate_status=str(e))
-    # run service
-    try:
-        service.validate_all()
-        # service.status_all()
-        service.run_all()
-    except Exception as e:
-        sheet_logger.log(log=str(e))
-    sheet_logger.log("========= end ==========")

+from typing import Annotated
+from apscheduler.schedulers.background import BackgroundScheduler
+from fastapi.encoders import jsonable_encoder
+from fastapi.exceptions import RequestValidationError
+from starlette.middleware.cors import CORSMiddleware
+from fastapi import FastAPI, Header, UploadFile, Depends, HTTPException, status
+import base64
+from fastapi.security import HTTPBearer, HTTPAuthorizationCredentials
+from starlette.responses import JSONResponse
+from collections import defaultdict
+from pydantic import BaseModel
+from threading import Lock
+from logger import get_now
+from run import main as run_main
+START_AT = get_now()
+app = FastAPI()
+lock = Lock()
+n_run = 0
+last_run = None
+is_running=False
+def scheduled_job():
+    with lock:
+        global is_running
+        if is_running:
+            return False
+        is_running = True
+    print("Job is running!")
+    run_main()
+    with lock:
+        global n_run
+        n_run = n_run + 1
+        global last_run
+        last_run = get_now()
+        is_running = False
+        return True
+# Create a scheduler
+scheduler = BackgroundScheduler()
+# Add the scheduled job to the scheduler
+scheduler.add_job(scheduled_job, 'interval', minutes=30)
+# Start the scheduler
+scheduler.start()
+# You can also stop the scheduler when the FastAPI application shuts down
+@app.on_event("shutdown")
+def shutdown_event():
+    scheduler.shutdown()
+class BaseResponse(BaseModel):
+    status: int = 1
+    message: str = ""
+    result: object = None
+@app.exception_handler(HTTPException)
+async def http_exception_handler(request, exc: HTTPException):
+    return JSONResponse(
+        status_code=status.HTTP_400_BAD_REQUEST,
+        content=jsonable_encoder(BaseResponse(status=0, message=exc.detail))
+    )
+@app.exception_handler(RequestValidationError)
+def validation_exception_handler(request, exc: RequestValidationError) -> JSONResponse:
+    reformatted_message = defaultdict(list)
+    for pydantic_error in exc.errors():
+        loc, msg = pydantic_error["loc"], pydantic_error["msg"]
+        filtered_loc = loc[1:] if loc[0] in ("body", "query", "path") else loc
+        field_string = ".".join(filtered_loc)
+        reformatted_message[field_string].append(msg)
+    return JSONResponse(
+        status_code=status.HTTP_400_BAD_REQUEST,
+        content=jsonable_encoder(BaseResponse(status=0, message="Invalid request", result=reformatted_message))
+    )
+@app.get("/status", response_model=BaseResponse)
+def status():
+    return BaseResponse(result={
+        "start_at": START_AT,
+        "current": get_now(),
+        "n_runs": n_run,
+        "last_run": last_run,
+    })
+@app.get("/run")
+def run_once():
+    print("Running the job once.")
+    success = scheduled_job()  # Manually trigger the job
+    if not success:
+        return BaseResponse(message="Job is running, not start a new job")
+    return BaseResponse(message="Job executed once.")
+app.add_middleware(
+    CORSMiddleware,
+    allow_origins=["*"],
+    allow_credentials=True,
+    allow_methods=["*"],
+    allow_headers=["*"],
+)

requirements.txt CHANGED Viewed

@@ -1,3 +1,8 @@
-kaggle
-gspread
-oauth2client

+kaggle
+gspread
+oauth2client
+pytz
+apscheduler
+fastapi
+starlette
+pydantic

run.py ADDED Viewed

	@@ -0,0 +1,130 @@

+from google_sheet import conf_repo, secret_repo
+import json
+from kaggle_service import KernelRerunService, NbJob
+from logger import sheet_logger, get_now
+from run_stt import run_stt_service
+def get_secret_dict():
+    # load all account and secret into a dict
+    secret_dict = {}
+    try:
+        for i in range(2, 50):  # note: read row 2 - 50
+            rs = secret_repo.read(i)
+            if not rs:
+                break
+            assert 'username' in rs
+            assert 'secret' in rs
+            username = rs['username'].rstrip()
+            secret = rs['secret'].rstrip()
+            secret_dict[username] = secret
+    except Exception as e:
+        sheet_logger.log(log="Get secret table failed!!" + str(e))
+    return secret_dict
+def get_config_list(secret_dict):
+    configs = []
+    ids = []
+    try:
+        for i in range(2, 50):     # note: read row 2 - 50
+            rs = conf_repo.read(i)
+            if not rs:
+                break
+            if not rs['config']:
+                reset_keys = []
+                for key in rs:
+                    if rs[key]:
+                        reset_keys.append(key)
+                if len(reset_keys) > 0:
+                    conf_repo.update(row_index=i, data={k: '' for k in reset_keys})
+                break
+            print(i, rs)
+            try:
+                # validation
+                # assert 'config' in rs, 'require config column'
+                assert 'usernames' in rs, 'require usernames column'
+                assert 'enable' in rs, 'require enable column'
+                assert rs['enable'].rstrip() in ['enable', 'disable'], rs['enable']
+                assert 'slug' in rs['config'], 'require config.slug'
+                cfg = json.loads(rs['config'])
+                usernames = set(rs['usernames']
+                             .rstrip().replace('\n', ' ').replace(',', ' ').replace(';', ' ').replace('|', ' ')
+                             .split(' '))
+                usernames = [u for u in usernames if u]
+                is_enabled = rs['enable'].rstrip() == 'enable'
+                if not is_enabled:
+                    sheet_logger.log(log="Disabled, skip!", nb=cfg['slug'])
+                    print("skip ", cfg['slug'])
+                    continue
+                assert len(usernames) > 0, 'len usernames == 0'
+                # process config
+                accounts = {u: secret_dict[u] for u in secret_dict if u in usernames}
+                assert not set(usernames).difference(set(accounts.keys())), set(usernames).difference(set(accounts.keys()))
+                cfg = {**cfg, "accounts": accounts}
+                # save
+                configs.append(cfg)
+                ids.append(i)
+                print(cfg)
+            except AssertionError:
+                import traceback
+                sheet_logger.update_job_status(i, validate_status=str(traceback.format_exc()))
+    except Exception:
+        import traceback
+        sheet_logger.log(log="Get config failed!!" + str(traceback.format_exc()))
+    return configs, ids
+def create_service(configs, ids):
+    service = KernelRerunService()
+    for config, idx in zip(configs, ids):
+        try:
+            service.add_job(NbJob.from_dict(config, id=idx))
+        except Exception as e:
+            sheet_logger.update_job_status(idx, validate_status=str(e))
+    return service
+def main():
+    sheet_logger.log("========= start ==========")
+    obj = run_stt_service.get_obj()
+    if run_stt_service.is_need_to_run(obj):
+        # start
+        run_stt_service.set_is_running({})
+        secret_dict = get_secret_dict()
+        # load config from gg sheet file
+        configs, ids = get_config_list(secret_dict)
+        # add config to service
+        service = create_service(configs, ids)
+        # run service
+        try:
+            service.validate_all()
+            # service.status_all()
+            service.run_all()
+        except Exception as e:
+            sheet_logger.log(log=str(e))
+        # done
+        run_stt_service.set_run_done()
+    else:
+        sheet_logger.log(f"Current time is {get_now()} is not after {obj.get('last_run')} {obj.get('auto_run_after_last_run')} or not require new run")
+    sheet_logger.log("========= end ==========")
+if __name__ == "__main__":
+    main()

run_stt.py ADDED Viewed

	@@ -0,0 +1,68 @@

+from google_sheet import run_stt_repo as _run_stt_repo, Converter
+from logger import get_now
+from dateutil import parser
+import datetime as dt
+class RunSttService:
+    def __init__(self, run_stt_repo):
+        self.run_stt_repo = run_stt_repo
+    def get_row(self):
+        config = self.run_stt_repo.read(2)
+        return config
+    def get_obj(self):
+        return Converter.convert_to_obj(self.get_row())
+    def is_need_to_run(self, obj):
+        is_running = obj['is_running']
+        if is_running:
+            return False
+        if obj['require_new_run']:
+            return True
+        last_run = parser.parse(obj['last_run'])
+        duration = obj['auto_run_after_last_run']
+        if not last_run:
+            return True
+        if not duration:
+            return False
+        # print(duration)
+        if get_now() - last_run > dt.timedelta(**duration):
+            return True
+        return False
+    def get_const_cfg(self, const_keys=['require_new_run', 'auto_run_after_last_run']):
+        row = self.get_row()
+        row = {k: row[k] for k in row if k in const_keys}
+        return row
+    def set_is_running(self, obj):
+        obj['last_run'] = str(get_now())
+        obj['is_running'] = True
+        obj = {**obj, **self.get_const_cfg()}
+        row = Converter.convert_to_row(obj)
+        print(row)
+        self.run_stt_repo.update(row_index=2, data=row)
+    def set_run_done(self):
+        obj = {
+            'is_running': False,
+            "require_new_run": False,
+            **self.get_const_cfg(['auto_run_after_last_run', 'last_run'])
+        }
+        row = Converter.convert_to_row(obj)
+        self.run_stt_repo.update(row_index=2, data=row)
+run_stt_service = RunSttService(_run_stt_repo)
+# if __name__ == '__main__':
+#     run_stt_service = RunSttService(_run_stt_repo)
+#     obj = run_stt_service.get_obj()
+#     print(run_stt_service.is_need_to_run(obj))
+#     run_stt_service.set_is_running({})
+#     import time
+#     time.sleep(10)
+#     run_stt_service.set_run_done()

test.ipynb CHANGED Viewed

@@ -1,160 +1,160 @@
-{
- "cells": [
-  {
-   "cell_type": "code",
-   "execution_count": 1,
-   "id": "initial_id",
-   "metadata": {
-    "collapsed": true,
-    "ExecuteTime": {
-     "end_time": "2023-11-05T00:47:48.131663100Z",
-     "start_time": "2023-11-05T00:47:35.527891600Z"
-    }
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Collecting kaggle\r\n",
-      "  Downloading kaggle-1.5.16.tar.gz (83 kB)\r\n",
-      "\u001B[2K     \u001B[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001B[0m \u001B[32m83.6/83.6 kB\u001B[0m \u001B[31m444.7 kB/s\u001B[0m eta \u001B[36m0:00:00\u001B[0m0:01\u001B[0m00:01\u001B[0m\r\n",
-      "\u001B[?25h  Preparing metadata (setup.py) ... \u001B[?25ldone\r\n",
-      "\u001B[?25hRequirement already satisfied: six>=1.10 in /home/kryo/miniconda3/envs/vlsp2023-tts-api/lib/python3.10/site-packages (from kaggle) (1.16.0)\r\n",
-      "Requirement already satisfied: certifi in /home/kryo/miniconda3/envs/vlsp2023-tts-api/lib/python3.10/site-packages (from kaggle) (2023.7.22)\r\n",
-      "Requirement already satisfied: python-dateutil in /home/kryo/miniconda3/envs/vlsp2023-tts-api/lib/python3.10/site-packages (from kaggle) (2.8.2)\r\n",
-      "Requirement already satisfied: requests in /home/kryo/miniconda3/envs/vlsp2023-tts-api/lib/python3.10/site-packages (from kaggle) (2.31.0)\r\n",
-      "Collecting tqdm (from kaggle)\r\n",
-      "  Downloading tqdm-4.66.1-py3-none-any.whl.metadata (57 kB)\r\n",
-      "\u001B[2K     \u001B[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001B[0m \u001B[32m57.6/57.6 kB\u001B[0m \u001B[31m332.3 kB/s\u001B[0m eta \u001B[36m0:00:00\u001B[0m \u001B[36m0:00:01\u001B[0m\r\n",
-      "\u001B[?25hCollecting python-slugify (from kaggle)\r\n",
-      "  Downloading python_slugify-8.0.1-py2.py3-none-any.whl (9.7 kB)\r\n",
-      "Requirement already satisfied: urllib3 in /home/kryo/miniconda3/envs/vlsp2023-tts-api/lib/python3.10/site-packages (from kaggle) (2.0.7)\r\n",
-      "Requirement already satisfied: bleach in /home/kryo/miniconda3/envs/vlsp2023-tts-api/lib/python3.10/site-packages (from kaggle) (6.1.0)\r\n",
-      "Requirement already satisfied: webencodings in /home/kryo/miniconda3/envs/vlsp2023-tts-api/lib/python3.10/site-packages (from bleach->kaggle) (0.5.1)\r\n",
-      "Collecting text-unidecode>=1.3 (from python-slugify->kaggle)\r\n",
-      "  Downloading text_unidecode-1.3-py2.py3-none-any.whl (78 kB)\r\n",
-      "\u001B[2K     \u001B[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001B[0m \u001B[32m78.2/78.2 kB\u001B[0m \u001B[31m944.9 kB/s\u001B[0m eta \u001B[36m0:00:00\u001B[0ma \u001B[36m0:00:01\u001B[0m\r\n",
-      "\u001B[?25hRequirement already satisfied: charset-normalizer<4,>=2 in /home/kryo/miniconda3/envs/vlsp2023-tts-api/lib/python3.10/site-packages (from requests->kaggle) (3.3.1)\r\n",
-      "Requirement already satisfied: idna<4,>=2.5 in /home/kryo/miniconda3/envs/vlsp2023-tts-api/lib/python3.10/site-packages (from requests->kaggle) (3.4)\r\n",
-      "Downloading tqdm-4.66.1-py3-none-any.whl (78 kB)\r\n",
-      "\u001B[2K   \u001B[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001B[0m \u001B[32m78.3/78.3 kB\u001B[0m \u001B[31m748.5 kB/s\u001B[0m eta \u001B[36m0:00:00\u001B[0m \u001B[36m0:00:01\u001B[0m\r\n",
-      "\u001B[?25hBuilding wheels for collected packages: kaggle\r\n",
-      "  Building wheel for kaggle (setup.py) ... \u001B[?25ldone\r\n",
-      "\u001B[?25h  Created wheel for kaggle: filename=kaggle-1.5.16-py3-none-any.whl size=110683 sha256=fbd426d35c51820adb030ee423c20d997221fd1cdb7093a4b6af3afa94d170f3\r\n",
-      "  Stored in directory: /home/kryo/.cache/pip/wheels/43/4b/fb/736478af5e8004810081a06259f9aa2f7c3329fc5d03c2c412\r\n",
-      "Successfully built kaggle\r\n",
-      "Installing collected packages: text-unidecode, tqdm, python-slugify, kaggle\r\n",
-      "Successfully installed kaggle-1.5.16 python-slugify-8.0.1 text-unidecode-1.3 tqdm-4.66.1\r\n"
-     ]
-    }
-   ],
-   "source": [
-    "!pip install kaggle"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "outputs": [],
-   "source": [],
-   "metadata": {
-    "collapsed": false
-   },
-   "id": "55f5e4a1d2ec2ecc"
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 4,
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\u001B[31mERROR: Could not find a version that satisfies the requirement kaggle_api_extended (from versions: none)\u001B[0m\u001B[31m\r\n",
-      "\u001B[0m\u001B[31mERROR: No matching distribution found for kaggle_api_extended\u001B[0m\u001B[31m\r\n",
-      "\u001B[0m"
-     ]
-    }
-   ],
-   "source": [],
-   "metadata": {
-    "collapsed": false,
-    "ExecuteTime": {
-     "end_time": "2023-11-05T00:51:45.918622100Z",
-     "start_time": "2023-11-05T00:51:45.022051100Z"
-    }
-   },
-   "id": "28cea8fd0c172fff"
-  },
-  {
-   "cell_type": "markdown",
-   "source": [
-    "## merge files"
-   ],
-   "metadata": {
-    "collapsed": false
-   },
-   "id": "fd44ed9dee4275cf"
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 6,
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Files merged successfully!\n"
-     ]
-    }
-   ],
-   "source": [
-    "import shutil\n",
-    "from pathlib import Path\n",
-    "try:\n",
-    "    with open(Path('merged_file.py'), 'wb') as destination_file:\n",
-    "        with open(Path('google_sheet.py'), 'rb') as file1:\n",
-    "            shutil.copyfileobj(file1, destination_file)\n",
-    "        with open(Path('logger.py'), 'rb') as file2:\n",
-    "            shutil.copyfileobj(file2, destination_file)\n",
-    "        with open(Path('kaggle_service.py'), 'rb') as file3:\n",
-    "            shutil.copyfileobj(file3, destination_file)\n",
-    "        with open(Path('main.py'), 'rb') as file4:\n",
-    "            shutil.copyfileobj(file4, destination_file)\n",
-    "    print(\"Files merged successfully!\")\n",
-    "except :\n",
-    "    raise Exception(\"Cannot merge files!\")"
-   ],
-   "metadata": {
-    "collapsed": false,
-    "ExecuteTime": {
-     "end_time": "2023-11-05T02:15:34.843461500Z",
-     "start_time": "2023-11-05T02:15:34.781001200Z"
-    }
-   },
-   "id": "2568f49413e2057c"
-  }
- ],
- "metadata": {
-  "kernelspec": {
-   "display_name": "Python 3",
-   "language": "python",
-   "name": "python3"
-  },
-  "language_info": {
-   "codemirror_mode": {
-    "name": "ipython",
-    "version": 2
-   },
-   "file_extension": ".py",
-   "mimetype": "text/x-python",
-   "name": "python",
-   "nbconvert_exporter": "python",
-   "pygments_lexer": "ipython2",
-   "version": "2.7.6"
-  }
- },
- "nbformat": 4,
- "nbformat_minor": 5
-}

+{
+ "cells": [
+  {
+   "cell_type": "code",
+   "execution_count": 1,
+   "id": "initial_id",
+   "metadata": {
+    "collapsed": true,
+    "ExecuteTime": {
+     "end_time": "2023-11-05T00:47:48.131663100Z",
+     "start_time": "2023-11-05T00:47:35.527891600Z"
+    }
+   },
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Collecting kaggle\r\n",
+      "  Downloading kaggle-1.5.16.tar.gz (83 kB)\r\n",
+      "\u001B[2K     \u001B[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001B[0m \u001B[32m83.6/83.6 kB\u001B[0m \u001B[31m444.7 kB/s\u001B[0m eta \u001B[36m0:00:00\u001B[0m0:01\u001B[0m00:01\u001B[0m\r\n",
+      "\u001B[?25h  Preparing metadata (setup.py) ... \u001B[?25ldone\r\n",
+      "\u001B[?25hRequirement already satisfied: six>=1.10 in /home/kryo/miniconda3/envs/vlsp2023-tts-api/lib/python3.10/site-packages (from kaggle) (1.16.0)\r\n",
+      "Requirement already satisfied: certifi in /home/kryo/miniconda3/envs/vlsp2023-tts-api/lib/python3.10/site-packages (from kaggle) (2023.7.22)\r\n",
+      "Requirement already satisfied: python-dateutil in /home/kryo/miniconda3/envs/vlsp2023-tts-api/lib/python3.10/site-packages (from kaggle) (2.8.2)\r\n",
+      "Requirement already satisfied: requests in /home/kryo/miniconda3/envs/vlsp2023-tts-api/lib/python3.10/site-packages (from kaggle) (2.31.0)\r\n",
+      "Collecting tqdm (from kaggle)\r\n",
+      "  Downloading tqdm-4.66.1-py3-none-any.whl.metadata (57 kB)\r\n",
+      "\u001B[2K     \u001B[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001B[0m \u001B[32m57.6/57.6 kB\u001B[0m \u001B[31m332.3 kB/s\u001B[0m eta \u001B[36m0:00:00\u001B[0m \u001B[36m0:00:01\u001B[0m\r\n",
+      "\u001B[?25hCollecting python-slugify (from kaggle)\r\n",
+      "  Downloading python_slugify-8.0.1-py2.py3-none-any.whl (9.7 kB)\r\n",
+      "Requirement already satisfied: urllib3 in /home/kryo/miniconda3/envs/vlsp2023-tts-api/lib/python3.10/site-packages (from kaggle) (2.0.7)\r\n",
+      "Requirement already satisfied: bleach in /home/kryo/miniconda3/envs/vlsp2023-tts-api/lib/python3.10/site-packages (from kaggle) (6.1.0)\r\n",
+      "Requirement already satisfied: webencodings in /home/kryo/miniconda3/envs/vlsp2023-tts-api/lib/python3.10/site-packages (from bleach->kaggle) (0.5.1)\r\n",
+      "Collecting text-unidecode>=1.3 (from python-slugify->kaggle)\r\n",
+      "  Downloading text_unidecode-1.3-py2.py3-none-any.whl (78 kB)\r\n",
+      "\u001B[2K     \u001B[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001B[0m \u001B[32m78.2/78.2 kB\u001B[0m \u001B[31m944.9 kB/s\u001B[0m eta \u001B[36m0:00:00\u001B[0ma \u001B[36m0:00:01\u001B[0m\r\n",
+      "\u001B[?25hRequirement already satisfied: charset-normalizer<4,>=2 in /home/kryo/miniconda3/envs/vlsp2023-tts-api/lib/python3.10/site-packages (from requests->kaggle) (3.3.1)\r\n",
+      "Requirement already satisfied: idna<4,>=2.5 in /home/kryo/miniconda3/envs/vlsp2023-tts-api/lib/python3.10/site-packages (from requests->kaggle) (3.4)\r\n",
+      "Downloading tqdm-4.66.1-py3-none-any.whl (78 kB)\r\n",
+      "\u001B[2K   \u001B[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001B[0m \u001B[32m78.3/78.3 kB\u001B[0m \u001B[31m748.5 kB/s\u001B[0m eta \u001B[36m0:00:00\u001B[0m \u001B[36m0:00:01\u001B[0m\r\n",
+      "\u001B[?25hBuilding wheels for collected packages: kaggle\r\n",
+      "  Building wheel for kaggle (setup.py) ... \u001B[?25ldone\r\n",
+      "\u001B[?25h  Created wheel for kaggle: filename=kaggle-1.5.16-py3-none-any.whl size=110683 sha256=fbd426d35c51820adb030ee423c20d997221fd1cdb7093a4b6af3afa94d170f3\r\n",
+      "  Stored in directory: /home/kryo/.cache/pip/wheels/43/4b/fb/736478af5e8004810081a06259f9aa2f7c3329fc5d03c2c412\r\n",
+      "Successfully built kaggle\r\n",
+      "Installing collected packages: text-unidecode, tqdm, python-slugify, kaggle\r\n",
+      "Successfully installed kaggle-1.5.16 python-slugify-8.0.1 text-unidecode-1.3 tqdm-4.66.1\r\n"
+     ]
+    }
+   ],
+   "source": [
+    "!pip install kaggle"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "outputs": [],
+   "source": [],
+   "metadata": {
+    "collapsed": false
+   },
+   "id": "55f5e4a1d2ec2ecc"
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 4,
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "\u001B[31mERROR: Could not find a version that satisfies the requirement kaggle_api_extended (from versions: none)\u001B[0m\u001B[31m\r\n",
+      "\u001B[0m\u001B[31mERROR: No matching distribution found for kaggle_api_extended\u001B[0m\u001B[31m\r\n",
+      "\u001B[0m"
+     ]
+    }
+   ],
+   "source": [],
+   "metadata": {
+    "collapsed": false,
+    "ExecuteTime": {
+     "end_time": "2023-11-05T00:51:45.918622100Z",
+     "start_time": "2023-11-05T00:51:45.022051100Z"
+    }
+   },
+   "id": "28cea8fd0c172fff"
+  },
+  {
+   "cell_type": "markdown",
+   "source": [
+    "## merge files"
+   ],
+   "metadata": {
+    "collapsed": false
+   },
+   "id": "fd44ed9dee4275cf"
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 6,
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Files merged successfully!\n"
+     ]
+    }
+   ],
+   "source": [
+    "import shutil\n",
+    "from pathlib import Path\n",
+    "try:\n",
+    "    with open(Path('merged_file.py'), 'wb') as destination_file:\n",
+    "        with open(Path('google_sheet.py'), 'rb') as file1:\n",
+    "            shutil.copyfileobj(file1, destination_file)\n",
+    "        with open(Path('logger.py'), 'rb') as file2:\n",
+    "            shutil.copyfileobj(file2, destination_file)\n",
+    "        with open(Path('kaggle_service.py'), 'rb') as file3:\n",
+    "            shutil.copyfileobj(file3, destination_file)\n",
+    "        with open(Path('main.py'), 'rb') as file4:\n",
+    "            shutil.copyfileobj(file4, destination_file)\n",
+    "    print(\"Files merged successfully!\")\n",
+    "except :\n",
+    "    raise Exception(\"Cannot merge files!\")"
+   ],
+   "metadata": {
+    "collapsed": false,
+    "ExecuteTime": {
+     "end_time": "2023-11-05T02:15:34.843461500Z",
+     "start_time": "2023-11-05T02:15:34.781001200Z"
+    }
+   },
+   "id": "2568f49413e2057c"
+  }
+ ],
+ "metadata": {
+  "kernelspec": {
+   "display_name": "Python 3",
+   "language": "python",
+   "name": "python3"
+  },
+  "language_info": {
+   "codemirror_mode": {
+    "name": "ipython",
+    "version": 2
+   },
+   "file_extension": ".py",
+   "mimetype": "text/x-python",
+   "name": "python",
+   "nbconvert_exporter": "python",
+   "pygments_lexer": "ipython2",
+   "version": "2.7.6"
+  }
+ },
+ "nbformat": 4,
+ "nbformat_minor": 5
+}

version.py CHANGED Viewed

	@@ -1 +1 @@
1	- VERSION="v1.0.1"


1	+ VERSION="v1.0.1"