En la compañía contamos con una gran organización de Exchange 2007 SP3 Rollup 3 V 2, donde tenemos 4 clúster SCC y 9 CAS/HUB.
El inconveniente radica en que queremos saber la causa raíz de la falla de una DB cuando se realizó un failover y aunque se tienen múltiples DB´s en este servidor (Clúster), solo una fallo, según revisamos el log de eventos encontramos el evento 9518 que dice que fue un inconveniente de cambio de letra de unidad al pasar los recursos o Antivirus pero ninguna de estas dos son las causas ya que las letras de las unidades SAN nunca cambió y al antivirus tiene las excepciones de carpetas y extensiones pero no se tiene la unidad SAN excluida, por otro lado encontramos que realizar un failover en este Clúster especifico es mas demorado de lo normal aproximadamente 5 Minutos y la DB fallida tenía un tamaño por encima de las recomendaciones de Microsoft 130 GB.
Revisando entonces encontramos lo siguiente:
- La Base de datos fallida se encontraba por encima del tamaño recomendado por Microsoft.
- El almacenamiento SAN que actualmente tiene este clúster presentado también está siendo usado por otras aplicaciones: SharePoint, datawarehousing y communicator, es decir la misma LUN está siendo compartida por otros sistemas, no es almacenamiento dedicado a Exchange.
- Esta falla ocurrió mediante una ejecución de failover
NOTA: la base de datos fue recuperada de un restore
En Resumen, lo anterior pudo afectar el funcionamiento de la Base de Datos? O un simple failover podría causar esta falla? Y porque después de un failover ocurre esto?
Elkin Hincapie MCSA 2003\MCTS 2008\ITIL V3\MCTS Exchange 2010