[go: up one dir, main page]

Skip to content

Latest commit

 

History

History
400 lines (266 loc) · 16.1 KB

README_JP.md

File metadata and controls

400 lines (266 loc) · 16.1 KB
hivision_logo

HivisionIDPhoto

English / 中文 / 日本語 / 한국어



関連プロジェクト

  • SwanLab:人物切り抜きモデルの訓練を通じて、分析と監視、ラボの仲間との協力と交流を行い、訓練効率を大幅に向上させました。

目次


🤩 最近の更新

  • オンライン体験: SwanHub DemoSpaces

  • 2024.09.11: Gradioデモに透過画像表示とダウンロード機能を追加しました。

  • 2024.09.09: 新しい背景除去モデル BiRefNet-v1-lite を追加 | Gradioに高度なパラメータ設定およびウォーターマークタブを追加

  • 2024.09.08: 新しい切り抜きモデル RMBG-1.4 を追加 | ComfyUIワークフロー - HivisionIDPhotos-ComfyUI AIFSHによる貢献

  • 2024.09.07: 顔検出APIオプション Face++ を追加し、より高精度な顔検出を実現

  • 2024.09.06: 新しい切り抜きモデル modnet_photographic_portrait_matting.onnx を追加

  • 2024.09.05: Restful API ドキュメント を更新

  • 2024.09.02: 写真のKBサイズを調整を更新、DockerHub

  • 2023.12.01: **APIデプロイ(fastapiベース)**を更新


プロジェクト概要

🚀 私たちの仕事に興味を持っていただきありがとうございます。画像分野における他の成果もぜひご覧ください。お問い合わせは、zeyi.lin@swanhub.co まで。

HivisionIDPhotoは、実用的で体系的な証明写真のスマート制作アルゴリズムを開発することを目的としています。

さまざまなユーザー撮影シーンの認識、切り抜きおよび証明写真の生成を実現するために、一連の洗練されたAIモデル作業フローを利用しています。

HivisionIDPhotoは以下のことができます:

  1. 軽量切り抜き(完全オフラインで、CPUのみで迅速に推論可能)
  2. 異なるサイズ仕様に基づいて異なる標準証明写真、六寸レイアウト写真を生成
  3. 完全オフラインまたはエッジクラウド推論をサポート
  4. 美顔(待機中)
  5. スマートな正装変更(待機中)

HivisionIDPhotoがあなたに役立つ場合は、このリポジトリをスターしたり、友人に推薦したりして、証明写真の緊急制作の問題を解決してください!


🏠 コミュニティ

私たちは、コミュニティによって構築されたHivisionIDPhotosの興味深いアプリケーションや拡張機能をいくつか共有しています:


🔧 準備作業

環境のインストールと依存関係:

  • Python >= 3.7(プロジェクトは主にpython 3.10でテストされています)
  • OS: Linux, Windows, MacOS

1. プロジェクトをクローンする

git clone https://github.com/Zeyi-Lin/HivisionIDPhotos.git
cd  HivisionIDPhotos

2. 依存環境をインストールする

condaでpython3.10の仮想環境を作成することをお勧めします。その後、以下のコマンドを実行してください。

pip install -r requirements.txt
pip install -r requirements-app.txt

3. 重みファイルをダウンロードする

方法一:スクリプトでダウンロード

python scripts/download_model.py --models all

方法二:直接ダウンロード

プロジェクトのhivision/creator/weightsディレクトリに保存します:

  • modnet_photographic_portrait_matting.onnx (24.7MB): MODNet公式の重み、ダウンロード
  • hivision_modnet.onnx (24.7MB): 単色背景に対して適応性の高い切り抜きモデル、ダウンロード
  • rmbg-1.4.onnx (176.2MB): BRIA AIのオープンソース切り抜きモデル、ダウンロード後にrmbg-1.4.onnxにリネーム
  • birefnet-v1-lite.onnx(224MB): ZhengPeng7のオープンソース切り抜きモデル、ダウンロード後にbirefnet-v1-lite.onnxにリネーム

4. 顔検出モデルの設定(オプション)

拡張顔検出モデル 説明 使用文書
MTCNN オフライン顔検出モデル、高性能CPU推論、デフォルトモデル、検出精度は低い このプロジェクトをクローン後、直接使用
Face++ Megviiが提供するオンライン顔検出API、高精度の検出、公式文書 使用文書

5. GPU推論の加速(オプション)

NVIDIA GPUによる推論加速を使用する場合は、CUDAとcuDNNがインストールされていることを確認し、文書に従って対応するonnxruntime-gpuバージョンをインストールします。例:

# CUDA 12.x, cuDNN 8
pip install onnxruntime-gpu==1.18.0

完了後、birefnet-v1-liteモデルを呼び出すと、GPUによる推論加速が利用されます。


🚀 デモの起動

python app.py

プログラムを実行すると、ローカルWebページが生成され、ページ内で証明写真の操作と対話が可能になります。


🚀 Python推論

コアパラメータ:

  • -i: 入力画像パス
  • -o: 保存画像パス
  • -t: 推論タイプ、idphoto、human_matting、add_background、generate_layout_photosから選択可能
  • --matting_model: 人物切り抜きモデル重みの選択
  • --face_detect_model: 顔検出モデルの選択

詳しいパラメータは、python inference.py --helpで確認できます。

1. 証明写真の制作

1枚の写真を入力し、1枚の標準証明写真と1枚の高解像度証明写真の4チャンネル透明PNGを得る。

python inference.py -i demo/images/test.jpg -o ./idphoto.png --height 413 --width 295

2. 人物切り抜き

python inference.py -t human_matting -i demo/images/test.jpg -o ./idphoto_matting.png --matting_model hivision_modnet

3. 透明画像に背景色を追加

1枚の4チャンネル透明PNGを入力し、背景色を追加した画像を得る。

python inference.py -t add_background -i ./idphoto.png -o ./idphoto_ab.jpg  -c 4f83ce -k 30 -r 1

4. 六寸レイアウト写真を得る

1枚の3チャンネル写真を入力し、1枚の六寸レイアウト写真を得る。

python inference.py -t generate_layout_photos -i ./idphoto_ab.jpg -o ./idphoto_layout.jpg  --height 413 --width 295 -k 200

⚡️ APIサービスのデプロイ

バックエンドを起動

python deploy_api.py

APIサービスにリクエスト

詳細なリクエスト方法はAPIドキュメントを参照してください。以下のリクエスト例が含まれます:


🐳 Dockerデプロイ

1. イメージをプルまたはビルドする

以下の方法から3つを選択してください。

方法一:最新のイメージをプル:

docker pull linzeyi/hivision_idphotos

方法二:Dockerfileから直接イメージをビルド:

モデル重みファイルhivision_modnet.onnxhivision/creator/weightsに配置したことを確認した後、プロジェクトのルートディレクトリで実行:

docker build -t linzeyi/hivision_idphotos .

方法三:Docker composeでビルド:

モデル重みファイルhivision_modnet.onnxhivision/creator/weightsに配置したことを確認した後、プロジェクトのルートディレクトリで実行:

docker compose build

2. サービスを実行

Gradioデモサービスを起動

次のコマンドを実行し、ローカルで http://127.0.0.1:7860 にアクセスすると使用可能です。

docker run -d -p 7860:7860 linzeyi/hivision_idphotos

APIバックエンドサービスを起動

docker run -d -p 8080:8080 linzeyi/hivision_idphotos python3 deploy_api.py

2つのサービスを同時に起動

docker compose up -d

環境変数

本プロジェクトは、いくつかの追加設定項目を提供し、環境変数を使用して設定します:

環境変数 タイプ 説明
FACE_PLUS_API_KEY オプション これはFace++コンソールで申請したAPIキーです。 7-fZStDJ····
FACE_PLUS_API_SECRET オプション Face++ APIキーに対応するSecret VTee824E····

dockerでの環境変数使用例:

docker run  -d -p 7860:7860 \
    -e FACE_PLUS_API_KEY=7-fZStDJ···· \
    -e FACE_PLUS_API_SECRET=VTee824E···· \
    linzeyi/hivision_idphotos 

📖 プロジェクトの引用

  1. MTCNN:
@software{ipazc_mtcnn_2021,
    author = {ipazc},
    title = {{MTCNN}},
    url = {https://github.com/ipazc/mtcnn},
    year = {2021},
    publisher = {GitHub}
}
  1. ModNet:
@software{zhkkke_modnet_2021,
    author = {ZHKKKe},
    title = {{ModNet}},
    url = {https://github.com/ZHKKKe/MODNet},
    year = {2021},
    publisher = {GitHub}
}

💻 開発のヒント

どのようにデフォルトのサイズと色を変更しますか?

  • サイズ:size_list_EN.csvを修正した後、再度app.pyを実行すれば、第一列がサイズ名、第二列が高さ、第三列が幅になります。
  • 色:color_list_EN.csvを修正した後、再度app.pyを実行すれば、第一列が色名、第二列がHex値になります。

ウォーターマークフォントの変更方法

  1. フォントファイルを hivision/plugin/font フォルダーに配置します。
  2. hivision/plugin/watermark.pyfont_file パラメータの値をフォントファイルの名前に変更します。

📧 お問い合わせ

ご不明な点がございましたら、zeyi.lin@swanhub.coまでメールをお送りください。


貢献者

Zeyi-LinSAKURA-CATFeudalmanswpfYKaikaikaifangShaohonChenKashiwaByte


StarHistory

Star History Chart