2025-01-01から1年間の記事一覧

ScalarDLによるデータ保証を検証

はじめに データ保証の必要性 ScalarDLとは ブロックチェーンとは ブロックチェーンの仕組み ブロックチェーンの特長 ScalarDLの強み 導入事例・ユースケース 1. 金融取引のトランザクション履歴管理 2. 医療機関における電子カルテの管理 検証 導入するコン…

Multimodal RAG experiments with LlamaIndex and Qdrant

Hello! This is Aurélie, an Artificial Intelligence Engineer at Ridge-i. In this blog post, I'll be sharing insights from a small trial where I experimented with LlamaIndex [1] and Qdrant [2] to build a multimodal Retrieval-Augmented Genera…

INTERSPEECH2024から見る音声認識研究の動向

はじめに INTERSPEECH 2024から見る音声認識研究の動向 複数話者の音声認識 複数言語の音声認識 デコーディング処理 文脈バイアス 表現学習 その他トピック まとめ 参考文献 はじめに 前回の記事では音声認識の基本と代表的な大規模学習済みモデルを紹介させ…

音声認識のための大規模学習済みモデルについて

はじめに 音声認識の基本的な仕組み CTC損失ベースの手法 RNN Transducer (RNN-t) Attentionベースの手法 音声に関する大規模学習済みモデル Wav2vec 2.0 HuBERT XLS-R WavLM Whisper まとめ 参考文献 はじめに AIとの関連性が高いタスクの1つに音声認識があ…

ScalarDB Clusterを利用して複数のDBにアクセスするアプリケーションをAmazon Elastic Kubernetes Service (Amazon EKS) 上にデプロイ

はじめに ScalarDB Clusterとは ScalarDB Coreライブラリとの違い ScalarDB Clusterを導入するメリットと活用シチュエーション 2つのアクセス方式 Indirect Client Mode direct-kubernetes client mode 構築・デプロイ 1. 前提条件 2. 作業環境セットアップ …

Flow-Guided Transformer for Video Inpainting (FGT++) Explained

Introduction to Video Inpainting Problem Definition Drawbacks in the Problem Formulation Common Challenges Categories of Existing Models Explanation of Optical Flow Paper Explanation FGT++ 2021 SOTA Model E2FGVI FGT++ vs. E2FGVI Comparison…

データ分散の課題を解決する「ScalarDB」のクイックスタートを試して使用感をレビュー

はじめに ScalarDBとは? ScalarDB導入のメリット 1. 接続方式が異なるDBに統合的にアクセスが可能 2. データベース間でのデータ整合性をシンプルな実装で担保可能 活用事例 1.ScalarDB を用いた 検索拡張生成(RAG)/ 大規模言語モデル(LLM)構築 2. 低コ…

A general overview of multimodal RAG

Hello, this is Aurélie, working as an Artificial Intelligence Engineer at Ridge-i. Today I would like to share an introduction to multimodal Retrieval-Augmented Generation (multimodal RAG) systems as part of a survey we conducted internall…