Gemini Configuration

Configure Google Gemini to power Simili Bot’s AI capabilities.

What is Gemini?

Google Gemini provides:

Text Embeddings: Convert issues to semantic vectors for similarity search
LLM Analysis: AI-powered duplicate detection, routing, triage, and quality assessment
Fast Processing: Cloud-based inference with minimal latency

Getting Started

1. Get API Key

Go to Google AI Studio
Sign in with your Google account
Click Get API key
Choose or create a Google Cloud project
Copy the generated API key

2. Set Up GitHub Secret

Store your API key securely:

Go to repository Settings → Secrets and variables → Actions
Create secret GEMINI_API_KEY
Paste your API key

3. Configure Simili Bot

Add to simili.yaml:

embedding:
  provider: "gemini"
  api_key: "${GEMINI_API_KEY}"
  model: "text-embedding-004"
  dimensions: 768

Configuration Reference

Embedding Settings

embedding:
  provider: "gemini"
  api_key: "${GEMINI_API_KEY}"
  model: "text-embedding-004"
  dimensions: 768
  batch_size: 100

Property	Type	Description	Default	Required
`provider`	string	Must be “gemini”	-	Yes
`api_key`	string	API key from Google AI Studio	-	Yes
`model`	string	Embedding model to use	text-embedding-004	No
`dimensions`	number	Vector dimensions	768	No
`batch_size`	number	Vectors per batch	100	No

Available Models

Model	Dimensions	Use Case	Cost
`text-embedding-004`	768	General purpose (recommended)	$0.025 per million tokens

Pricing

Google Gemini offers a free tier: Free Tier:

Embeddings: 50 requests per minute
LLM: 15 requests per minute
Generous monthly quotas

Paid (if needed):

Pay-as-you-go pricing
No monthly minimum
Bulk discounts available

Estimate for 1000 issues:

Embeddings: ~$0.01-0.05
LLM analysis: $0.10-0.50 (depending on feature usage)

Common Issues & Solutions

API Key Not Valid

Error: Error 400: Invalid API key Solutions:

Verify key is correct from Google AI Studio
Check key hasn’t expired or been revoked
Ensure no extra spaces in secret value
Try regenerating key in Google AI Studio
Verify project has API enabled

Rate Limited

Error: Error 429: Rate limit exceeded Solutions:

For free tier: Add delays between API calls
Reduce batch size for embeddings
Upgrade to paid plan if consistent usage
Distribute processing over time

Model Not Found

Error: model 'text-embedding-004' not found Solutions:

Check model name spelling exactly
Verify Google has enabled this model in your region
Try default model by omitting model setting
Check project has sufficient quota

Advanced Configuration

Batch Processing

For bulk indexing, control batch size:

embedding:
  provider: "gemini"
  api_key: "${GEMINI_API_KEY}"
  batch_size: 50  # Smaller = more requests, less rate limiting

Smaller batches help with rate limiting but increase request count.

Custom Prompts

LLM analysis uses templated prompts for:

Duplicate detection
Quality assessment
Issue routing
Label suggestions

These are built-in and optimized for Gemini.

Integration Points

Gemini is used for:

1. Embeddings (for all issues)

Issue text → Embedding → Vector storage

2. Similarity Search (optional, if configured)

Find similar issues → Return top N

3. Duplicate Detection (optional)

Compare similar issues → AI analysis → Confidence score

4. Quality Assessment (optional)

Analyze issue description → Score → Suggestions

5. Auto Triage (optional)

Analyze issue → Suggest labels → Post to GitHub

6. Smart Routing (optional)

Analyze issue + repositories → Route decision

Monitoring API Usage

In Google AI Studio

Go to Google AI Studio
Click your API key
View usage and quotas

Common Metrics

Tokens processed
Requests made
Current month usage
Rate limit status

Cost Optimization

Reduce API Calls

Use workflow presets:

# Only index, no AI analysis
simili process --workflow index-only

# Only semantic search, no LLM
simili process --workflow similarity-only

Disable features you don’t need:

# In transfer config, disable LLM routing
transfer:
  llm_routing_enabled: false

Batch Operations

Index multiple issues together:

# Bulk index with 10 workers
simili index --repo owner/repo --since 30d --workers 10

Batching reduces per-issue overhead.

Archive Old Issues

Periodically clean up:

Close resolved issues
Archive old discussions
Reduces embedding storage costs in Qdrant

Testing

Verify Configuration

export GEMINI_API_KEY="your-key"
simili process --issue test.json --config simili.yaml --dry-run

Should output analysis without errors.

Test Dry-Run

Try without posting to GitHub:

simili process --issue test.json --config simili.yaml --dry-run

Monitor Logs

Check output for:

Successful embeddings
API response times
Error messages
Rate limit warnings

Next Steps

Qdrant Setup

Configure vector database

Configuration Overview

View all configuration options

Semantic Search Guide

Learn how semantic search works

Introduction

Choose Your Path

Setup Guides

Configuration

​Gemini Configuration

​What is Gemini?

​Getting Started

​1. Get API Key

​2. Set Up GitHub Secret

​3. Configure Simili Bot

​Configuration Reference

​Embedding Settings

​Available Models

​Pricing

​Common Issues & Solutions

​API Key Not Valid

​Rate Limited

​Model Not Found

​Advanced Configuration

​Batch Processing

​Custom Prompts

​Integration Points

​1. Embeddings (for all issues)

​2. Similarity Search (optional, if configured)

​3. Duplicate Detection (optional)

​4. Quality Assessment (optional)

​5. Auto Triage (optional)

​6. Smart Routing (optional)

​Monitoring API Usage

​In Google AI Studio

​Common Metrics

​Cost Optimization

​Reduce API Calls

​Batch Operations

​Archive Old Issues

​Testing

​Verify Configuration

​Test Dry-Run

​Monitor Logs

​Next Steps